L’IA Grok d’Elon Musk s’améliore en mathématiques

Grok-1.5 rattrape ChatGPT d’OpenAI et Gemini AI de Google

Par Rocio Fabbro3 min de lectureMis à jour 29 mars 2024

Grok, le chatbot IA d’Elon Musk, passe au niveau supérieur alors qu’il rattrape son retard par rapport à ses principaux concurrents dans le grand modèle linguistique (LLM). arène.

xAI, la startup fondée par l’entrepreneur milliardaire Musc en juillet dernier en réponse à ses réticences avec OpenAI modèle générant des bénéfices, a publié les principales caractéristiques du prochaine version de Grok jeudi: Grok-1.5.

La dernière version du LLM (ou du système qui comprend et génére des textes en langue humaine) a des améliorations assez importantes, selon le l’entreprise. L’annonce se concentre sur les mesures de performance améliorées de Grok, ce qui constitue un contraste marqué avec la marque du PDG de Grok en tant que société. sournois, sarcastique alternative aux chatbots existants.

La société vante désormais la capacité plus sophistiquée de Grok à effectuer des tâches de codage et liées aux mathématiques, ce qui la rapproche des résultats obtenus avec Gemini de Google $GOOGL. modèle et ChatGPT d’OpenAI. Dans le référence MATH — l’une des deux mesures mathématiques qui inclut la résolution de problèmes de l’école primaire au lycée — Grok-1.5 obtient un score de précision de 50,6 %, a déclaré la société. C’est une augmentation par rapport au score de 23,9 % de Grok-1. Pendant ce temps, Gemini Pro 1.5 a obtenu un score de 58,5 %, ChatGPT a obtenu 52,9%, et Claude 3 Opus d’Anthropic, qui a publié au début de ce mois, a atteint 61 %, le plus élevé de tous les autres modèles d’IA.

Lire la suite: L’investissement de 4 milliards de $d’Amazon $AMZN dans la startup d’IA Anthropic est le plus important jamais

En plus des mathématiques, Grok-1.5 marque également une amélioration des capacités linguistiques du modèle. Le chatbot sera mieux capable de comprendre à long terme contexte et un raisonnement avancé, avec une capacité de mémoire accrue jusqu’à 16 fois la longueur du contexte précédent, a déclaré xAI.

Pour être clair : Grok est toujours à la traîne par rapport à presque tous les autres modèles majeurs d’IA dans presque tous les critères. Malgré les probabilités, Musk se vante toujours qu’un prochain Grok-2 « dépassera l’IA actuelle sur toutes les mesures », ajoutant que le prochain modèle est en formation.

Les premiers testeurs et les utilisateurs existants de Grok sur X $TWTR, que Musk a acheté sous le nom de Twitter en octobre 2022, pourront tester la version 1.5 d’ici la semaine prochaine, a déclaré Musk dans le même post sur le site.

Quand xAI a lancé Grok en novembre, Musk a présenté le modèle comme un plus savoureux et plus sympathique un ajout au paysage IA existant — avec accès à la pléthore de connaissances et de personnalités sur X.

xAI s’est efforcé de rattraper ses concurrents bien adoptés. Peut-être pour attirer plus d’utilisateurs, Musk made Grok open-source plus tôt ce mois-ci. Cette décision intervient alors que Musk mène un procès en cours avec OpenAI, la société que Musk a aidé à fonder en 2015. et il a quitté 3 ans plus tard en raison de différences idéologiques.

L'essentiel de l'actualité économique, livré chaque matin.

Rejoignez plus de 500 000 lecteurs qui commencent leur journée avec Quartz.

En vous abonnant, vous acceptez nos Conditions d'utilisation et notre Politique de confidentialité.