Ne trêge pas à Gemini 2.5 Pro de Google

Table des matières

Après l'accord sans précédent entre Openai et Google, maintenant le premier Lance O3-Proun modèle d'IA que l'entreprise crie qu'il est le plus capable jusqu'à présent.

O3-Pro est un Version du modèle de raisonnement Openai O3 que le Démarrer Il a lancé plus tôt cette année. Un type de modèle qui, vice versa cette IA conventionnelle, développe les problèmes étape par étape.

Cela vous permet de fonctionner beaucoup mieux dans matières telles que la physique, les mathématiques et le codage. Un bond en avant qui frappe Chatgpt en duel avec Gemini 2.5 Pro mis à jour il y a quelques jours et Claude 4 Opus of Anthropic.

O3-Pro est désormais disponible pour les utilisateurs qui paient pour le Abonnement Progpt Pro et équipe Depuis hier, et remplace le modèle O1-Pro. Les utilisateurs de l'entreprise et de l'EDU auront accès la semaine prochaine.

Le API pour les développeurs Il a déjà O3-Pro depuis des heures. O3-Pro a un coût de 20 $ pour un million de jetons d'entrée et 80 $ par million de jetons de départ dans l'API.

Pour mieux comprendre ces chiffres, un million de jetons équivalent à environ 750 000 motsun peu plus qu'un roman comme Guerre et paix De Lev Tolstob. Les entreprises IA facturent des tiers pour la génération du texte à travers ces jetons.

Et maintenant l'intéressant La performance O3-Pro. Openai soutient que, selon les évaluations des experts, ils préfèrent l'O3-Pro sur O3 dans toute catégorie éprouvée, et en particulier dans des questions clés telles que la science, l'éducation, la programmation, les affaires et l'écriture.

C'est O3-Pro face à d'autres modèles OpenAI

Openai

Il y a un autre point clé dans O3-Proet c'est votre accès à des outils tels que la recherche Web, l'analyse de fichiers, le raisonnement sur les entrées visuelles, est capable d'utiliser Python, personnalise vos réponses et plus encore.

Il y a plusieurs limites Dans la nouvelle expérience selon le Démarrer depuis Votre site Web. La première est que le modèle met un peu plus de temps à répondre que O1-Pro, comme Openai maintient.

Un autre est que Les chats temporaires sont désactivés tandis qu'un problème technique est résolu. Et à la fois la génération d'images avec l'IA et l'utilisation de toile, leur fonction d'espace de travail, ne sont pas prises en charge par O3-Pro.

La question suivante que nous nous posons est Comment payer d'autres modèles Afin de vraiment adapter votre capacité: O3-Pro obtient des scores impressionnants dans le Repères des plus populaires.

Dans l'AIME 2024, selon TechCrunchun test capable d'évaluer les compétences mathématiques du modèle, Score O3-Pro meilleur que Gemini 2.5 ProTop Model de Google. O3-Pro a également battu Claude 4 Opus dans GPQA Diamond.

Nous n'avons toujours pas de tableau comparatif dans lequel nous pouvons apprécier les différences avec les modèles d'IA mentionnés ainsi que la dernière mise à jour Deepseek R1 qui est arrivée il y a quelques semaines.

Leave a Reply