OpenAI dévoile o3, son prochain modèle de « raisonnement »

La start-up d’IA a annoncé qu’elle prévoyait de lancer o3-mini à la fin du mois de janvier

Nous pouvons gagner une commission sur les liens sur cette page.
Sam Altman porte un sweat-shirt gris-vert, sourit et regarde quelque chose
Sam Altman, PDG d’OpenAI, aux studios Fox Business Network, le 4 décembre 2024 à New York.
Photo: Mike Coppola (Getty Images)

OpenAI a terminé sa série de lancements de produits « 12 jours d’OpenAI » en dévoilant le successeur de son premier modèle de « raisonnement ».

Publicité

La nouvelle famille de modèles Frontier comprend o3 et o3-mini, a déclaré vendredi la start-up spécialisée dans l’intelligence artificielle. Aucun des deux modèles n’est encore lancé publiquement, mais ils le sont désormais disponible pour les tests de sécurité publique.

« Nous considérons cela comme le début de la prochaine phase de l’IA, où vous pourrez utiliser ces modèles pour effectuer des tâches de plus en plus complexes qui nécessitent beaucoup de raisonnement », a déclaré le directeur général d’OpenAI, Sam Altman, lors d’une annonce diffusée en direct.

Publicité

La start-up d’IA abandonne le nom 02, a déclaré Altman, « par respect pour nos amis de Telefónica (TEF-0.74%), et dans la grande tradition d’OpenAI étant vraiment, vraiment mauvais en matière de noms. O2, une marque de Telefónica en Espagne, est un opérateur de réseau mobile au Royaume-Uni

Publicité

Pour la première fois, OpenAI ouvre les modèles à des tests de sécurité externes. Les chercheurs en sécurité peuvent s’inscrire pour prévisualiser et tester les modèles, a déclaré Altman, ajoutant que la start-up prévoit de lancer o3-mini vers la fin janvier, suivi du modèle o3 complet peu de temps après.

Publicité

Par rapport à 01 et o1-mini, lancés en septembre, o3 a surpassé o1 de près de 23 points de pourcentage SWE-Bench Vérifié évaluation, et a atteint une note Codeforces de 2727, a déclaré OpenAI. L’ancien test est une évaluation interne, alors prenez-le avec des pinces de sel. Pendant ce temps, le scientifique en chef d’OpenAI a obtenu un score de 2665, selon la startup. Le nouveau modèle a également établi un record dans l’évaluation Frontier Math d’EpochAI, a déclaré OpenAI, et apparemment plus que triplé le score de o1 au test ARC-AGI.

OpenAI a lancé la version complète de son o1 modèle hors aperçu au cours du premier jour de son programme promotionnel « 12 jours d’OpenAI ». La start-up a également annoncé un nouveau niveau d’abonnement de 200 $ par mois pour ChatGPT, appelé ChatGPT Pro, qui inclut une version plus avancée de o1 appelée mode o1 pro.

Publicité

Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.

Publicité