C'est Claude 4 avec ses deux nouveaux modèles

Table des matières

Google est revenu sur le chemin de la victoire dans les modèles d'IA avec Gemini 2.5 Pro, mais a été dépassé pendant quelques jours avec Claude Opus 4 et Claude Sonnet 4les deux nouveaux modèles anthropes qui élèvent la barre avec de nouveaux objectifs atteints.

Claude Opus 4 devient le meilleur modèle de codage grâce à son énorme Capacité à gérer des tâches complexes et les workflows des agents ai. Alors que Claude Sonnet 4 est une mise à jour importante de Claude Sonnet 3.7, le dernier modèle sorti en février.

En anthropic, ils ont des raisons de joie, non seulement pour ces deux modèles, mais parce que maintenant cela comprend la possibilité de Utilisez “la pensée étendue” et même rechercher sur le Web en même temps. Claude peut désormais utiliser l'un ou l'autre pour donner de meilleures réponses.

Claude Opus 4 et Sonnet 4 sont modèles hybrides qui offrent à la fois des réponses instantanées et une réflexion prolongée pour un raisonnement plus complexe. Et celui qui reste libre d'être libre est le premier, donc Sonnet 4 est déjà disponible en Espagne, bien que d'une manière limitée comme Sonnet a été selon Jetons qui sont utilisés.

Claude Sonnet 4 améliore le sonnet 3.7 en codage avec 72,7% dans SWE-Bench. La clé du nouveau modèle est la capacité d'équilibrer les performances et l'efficacité des cas externes et internes. Il n'atteint pas la capacité d'Opus 4 dans beaucoup de ses domaines, mais offre une grande expérience en termes généraux.

Les performances des deux modèles anthropiques

Anthropique

Claude Opus 4 devient le modèle de performance le plus élevé jusqu'à la date anthropique et le meilleur modèle de programmation En dépassant les Gémeaux 2.5 Proce qui a surpris le sien et les étrangers avec la grande étape franchie par Google depuis qu'il l'a déployé. Les chiffres de l'Opus 4 sont de 72,5% dans le banc SWE et 43,2%.

L'une de ses meilleures compétences concerne l'exécution des tâches qui prennent beaucoup de temps et qui nécessitent des efforts continus et des milliers de mesures, et avec le supplément, cela signifie qu'il fonctionne en continu pendant de nombreuses heures. En codage, il devient le modèle numéro un actuel, en particulier dans la compréhension des bases de code complexes.

Il y en a plus et Anthropic a également annoncé les nouvelles capacités des deux modèles pour utiliser des outils en parallèle, suivre les instructions plus précisément et donner accès aux archives locales pour les développeurs. En fait, Claude Opus 4 ne sera disponible que via l'abonnement Pro, Max, Team et Enterprise en Espagne.

Il y a deux détails intéressants dans les améliorations des deux modèles: le comportement de l'utilisation de l'accès direct ou Appartements. Opus 4 ha capacité de mémoire considérablement améliorée en pouvant conserver les fichiers de mémoire auxquels il a accédé localement sur le PC.

Résultats des deux modèles en génie logiciel

Résultats des deux modèles en génie logiciel

Anthropique

En résumé, et comme anthropique maintient de son annonce sur son site Web, Sonnet 4 apporte de meilleures performances pour les tâches quotidiennes En tant que mise à jour importante de Sonnet 3.7, et Opus 4 dépasse les limites de codage, de recherche, d'écriture et de découverte scientifique.

De cette façon, la roue dans laquelle Openai, Google et Anthropic se surmontent les uns les autres Chaque fois qu'ils lancent une plus grande mise à jour de leurs modèles d'IA. Maintenant, le jeu des créateurs de Chatgpt est proche de l'annonce du GPT-5.

Leave a Reply