Anthropic publie son modèle Claude 3.7 Sonnet doué de "raisonnement hybride"

Se concentrant sur les tâches "du monde réel" qui reflètent mieux l'usage des LLM en entreprise, Anthropic a fait quelques concessions en matière de mathématiques et d'informatique pour son modèle Claude 3.7 Sonnet. En contrepartie, la start-up apporte un agent dédié au code destiné aux développeurs.

Anthropic modele Claude
Anthropic estime que Claude 3.7 Sonnet et Claude Code marquent une étape importante vers des systèmes d’IA capables d’augmenter véritablement les capacités humaines.

Anthropic revient en force avec son modèle Claude 3.7 Sonnet. Publié cette semaine, son modèle "présente de fortes améliorations dans l'utilisation de l'ordinateur et les capacités de codage", assure la start-up. Il peut produire des réponses quasi-instantanées ou des raisonnements détaillés, étape par étape, qui sont visibles pour l'utilisateur grâce à ses deux modes : standard et étendu.

Une particularité qu'Anthropic analyse ainsi : "En mode standard, Claude 3.7 Sonnet représente une version améliorée de Claude 3.5 Sonnet. En mode de réflexion étendue, il s'interroge avant de répondre, ce qui améliore ses performances en mathématiques, physique, suivi d'instructions, codage et de nombreuses autres tâches. Nous constatons généralement que l'invite pour le modèle fonctionne de manière similaire dans les deux modes".

Un modèle accessible en termes de prix

Les utilisateurs de l'API peuvent également ajuster en continu la durée de réflexion du modèle et contrôler le budget alloué au raisonnement, ce qui permet d'échanger la vitesse (et le coût) contre la qualité de la réponse. Claude 3.7 Sonnet est disponible sur tous les plans Claude (Free, Pro, Team et Enterprise), ainsi que sur l'API Anthropic, Amazon Bedrock et Vertex AI de Google Cloud.

Le mode de réflexion étendu est disponible sur tous les abonnements, à l'exception du niveau Claude gratuit. Dans les modes de pensée standard et étendu, Claude 3.7 Sonnet a le même prix que ses prédécesseurs : 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie, ce qui inclut les jetons de réflexion. Par comparaison, OpenAI annonce les coûts d'utilisation suivants pour GPT-4o via l'API : 2,50 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie.

Un agent dédié au code

Dans le même temps, la start-up annonce lancer son premier agent de codage, Claude Code. Disponible pour l'heure en version "limited research preview", il s'adresse surtout aux développeurs. Anthropic affirme avoir fait ce choix pour une raison simple : ses revenus annualisés provenant de la génération de code et du développement de logiciels ont été multipliés par 10 au cours du dernier trimestre de 2024 seulement. "Ce n'est pas pour rien que des produits de codage comme Cursor, Windsurf, etc. ont choisi Claude comme modèle par défaut", se vante la start-up.

Les premiers tests semblent par ailleurs convaincants : Claude Code a réalisé en une seule passe des tâches qui nécessiteraient normalement plus de 45 minutes de travail manuel, réduisant ainsi le temps de développement et les frais généraux liés. Dans les semaines à venir, Anthropic prévoit de l'améliorer, notamment sur la fiabilité des appels d'outils, l'ajout de la prise en charge des commandes de longue durée ou encore le rendu dans l'application.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.