Anthropic Publie Claude Fable 5, un Modèle Autrefois Jugé Trop Puissant pour être Déployé
Anthhropic a publiquement lancé Claude Fable 5, une déclinaison de son système d'IA Claude Mythos — un programme qui a précédemment alarmé les cadres technologiques, les institutions financières et les responsables gouvernementaux par ses capacités. La publication marque un revirement significatif : un modèle délibérément retenu de l'accès public est désormais disponible pour les utilisateurs généraux, soulevant immédiatement des questions sur ce qui a changé et pourquoi.
Claude Mythos avait suscité une inquiétude inhabituelle entre les secteurs depuis son développement. Il est rare qu'un seul programme d'IA préoccupe simultanément les leaders à travers la technologie, la finance et le gouvernement — trois communautés ayant des tolérances aux risques et des priorités distinctes. Cette ampleur d'anxiété suggérait que le système démontrait des capacités touchant à plusieurs domaines à enjeux élevés, qu'il s'agisse du raisonnement autonome, de la persuasion, de la génération de code, ou d'une combinaison de ceux-ci. Anthropic n'a pas détaillé publiquement les caractéristiques spécifiques de Claude Mythos qui ont déclenché ces préoccupations.
Claude Fable 5 est décrit comme une version de ce système sous-jacent, ce qui implique qu'Anthropic a appliqué des contraintes, un ajustement ou des restrictions de capacités avant de procéder au lancement public. Cette approche — développer un modèle de pointe en interne, évaluer ses risques avec des parties prenantes sélectionnées et lancer une variante modifiée — reflète un schéma devenant de plus en plus courant dans le développement d'IA avancée. Elle reflète une tension calculée entre la pression compétitive de commercialiser des produits puissants et les obligations de réputation et de sécurité sur lesquelles des entreprises comme Anthropic ont fondé leurs identités.
Pour l'industrie plus large de l'IA, le lancement comporte une ironie pointue intégrée dans son propre encadrage : le label même « trop puissant pour le public » est devenu un contexte marketing plutôt qu'une limite infranchissable. Si les préoccupations concernant les capacités peuvent être résolvées par versioning et ajustement au stade du lancement, cela normalise un pipeline où aucun modèle n'est jamais définitivement retenu — seulement retardé. Ce précédent sera étroitement observé par les régulateurs de l'UE, du Royaume-Uni et des États-Unis qui élaborent activement des cadres de gouvernance pour les systèmes d'IA avancés.
Des détails critiques restent non résolus. Il n'est pas encore clair quelles capacités spécifiques étaient présentes dans Claude Mythos complet et qui ont été modifiées ou supprimées dans Fable 5, ni quels critères d'évaluation ou évaluations tierces ont informé la décision d'Anthropic de procéder. La nature de la « perturbation » parmi les leaders gouvernementaux — qu'elle ait impliqué des présentations formelles, des consultations réglementaires ou des inquiétudes informelles — n'a pas été divulguée. La façon dont Fable 5 se comportera par rapport aux modèles de pointe concurrents d'OpenAI et Google deviendra claire à mesure que les évaluations indépendantes émergeront dans les jours à venir.