OpenAI a terminé sa série de lancements de produits « 12 jours d’OpenAI » en dévoilant le successeur de son premier modèle de « raisonnement ».
La nouvelle famille de modèles Frontier comprend o3 et o3-mini, a déclaré vendredi la start-up spécialisée dans l’intelligence artificielle. Aucun des deux modèles n’est encore lancé publiquement, mais ils le sont désormais disponible pour les tests de sécurité publique.
« Nous considérons cela comme le début de la prochaine phase de l’IA, où vous pourrez utiliser ces modèles pour effectuer des tâches de plus en plus complexes qui nécessitent beaucoup de raisonnement », a déclaré le directeur général d’OpenAI, Sam Altman, lors d’une annonce diffusée en direct.
La start-up d’IA abandonne le nom 02, a déclaré Altman, « par respect pour nos amis de Telefónica (TEF-0.74%), et dans la grande tradition d’OpenAI étant vraiment, vraiment mauvais en matière de noms. O2, une marque de Telefónica en Espagne, est un opérateur de réseau mobile au Royaume-Uni
Pour la première fois, OpenAI ouvre les modèles à des tests de sécurité externes. Les chercheurs en sécurité peuvent s’inscrire pour prévisualiser et tester les modèles, a déclaré Altman, ajoutant que la start-up prévoit de lancer o3-mini vers la fin janvier, suivi du modèle o3 complet peu de temps après.
Par rapport à 01 et o1-mini, lancés en septembre, o3 a surpassé o1 de près de 23 points de pourcentage SWE-Bench Vérifié évaluation, et a atteint une note Codeforces de 2727, a déclaré OpenAI. L’ancien test est une évaluation interne, alors prenez-le avec des pinces de sel. Pendant ce temps, le scientifique en chef d’OpenAI a obtenu un score de 2665, selon la startup. Le nouveau modèle a également établi un record dans l’évaluation Frontier Math d’EpochAI, a déclaré OpenAI, et apparemment plus que triplé le score de o1 au test ARC-AGI.
OpenAI a lancé la version complète de son o1 modèle hors aperçu au cours du premier jour de son programme promotionnel « 12 jours d’OpenAI ». La start-up a également annoncé un nouveau niveau d’abonnement de 200 $ par mois pour ChatGPT, appelé ChatGPT Pro, qui inclut une version plus avancée de o1 appelée mode o1 pro.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.