OpenAI dévoile o3, son prochain modèle de « raisonnement »

La start-up d’IA a annoncé qu’elle prévoyait de lancer o3-mini à la fin du mois de janvier

Par Britney Nguyen2 min de lectureMis à jour 20 décembre 2024

OpenAI a terminé sa série de lancements de produits « 12 jours d’OpenAI » en dévoilant le successeur de son premier modèle de « raisonnement ».

La nouvelle famille de modèles Frontier comprend o3 et o3-mini, a déclaré vendredi la start-up spécialisée dans l’intelligence artificielle. Aucun des deux modèles n’est encore lancé publiquement, mais ils le sont désormais disponible pour les tests de sécurité publique.

« Nous considérons cela comme le début de la prochaine phase de l’IA, où vous pourrez utiliser ces modèles pour effectuer des tâches de plus en plus complexes qui nécessitent beaucoup de raisonnement », a déclaré le directeur général d’OpenAI, Sam Altman, lors d’une annonce diffusée en direct.

La start-up d’IA abandonne le nom 02, a déclaré Altman, « par respect pour nos amis de Telefónica (TEF), et dans la grande tradition d’OpenAI étant vraiment, vraiment mauvais en matière de noms. O2, une marque de Telefónica en Espagne, est un opérateur de réseau mobile au Royaume-Uni

Pour la première fois, OpenAI ouvre les modèles à des tests de sécurité externes. Les chercheurs en sécurité peuvent s’inscrire pour prévisualiser et tester les modèles, a déclaré Altman, ajoutant que la start-up prévoit de lancer o3-mini vers la fin janvier, suivi du modèle o3 complet peu de temps après.

Par rapport à 01 et o1-mini, lancés en septembre, o3 a surpassé o1 de près de 23 points de pourcentage SWE-Bench Vérifié évaluation, et a atteint une note Codeforces de 2727, a déclaré OpenAI. L’ancien test est une évaluation interne, alors prenez-le avec des pinces de sel. Pendant ce temps, le scientifique en chef d’OpenAI a obtenu un score de 2665, selon la startup. Le nouveau modèle a également établi un record dans l’évaluation Frontier Math d’EpochAI, a déclaré OpenAI, et apparemment plus que triplé le score de o1 au test ARC-AGI.

OpenAI a lancé la version complète de son o1 modèle hors aperçu au cours du premier jour de son programme promotionnel « 12 jours d’OpenAI ». La start-up a également annoncé un nouveau niveau d’abonnement de 200 $ par mois pour ChatGPT, appelé ChatGPT Pro, qui inclut une version plus avancée de o1 appelée mode o1 pro.

L'essentiel de l'actualité économique, livré chaque matin.

Rejoignez plus de 500 000 lecteurs qui commencent leur journée avec Quartz.

En vous abonnant, vous acceptez nos Conditions d'utilisation et notre Politique de confidentialité.

OpenAI dévoile o3, son prochain modèle de «&#xa0;raisonnement&#xa0;»

L'essentiel de l'actualité économique, livré chaque matin.

OpenAI dévoile o3, son prochain modèle de « raisonnement »