Une nouvelle mystérieuse Chatbot IA appelé “gpt2-chatbot” fait tourner les têtes cette semaine après qu’il soit devenu disponible sur un grand site d’analyse comparative de modèles linguistiques, LMSYS Org. Non on sait d’où il vient, mais beaucoup considèrent qu’il a à peu près les mêmes capacités que le GPT-4 d’OpenAI. Cela place gpt2-chatbot dans une classe rare de modèles d’IA que seule une poignée de développeurs dans le monde ont pu réaliser.
« Personne ne sait qui l’a fabriqué ni ce que c’est, mais j’ai joué un peu avec et il semble que ce soit le cas. dans le même niveau de capacité que GPT-4 », Ethan Mollick, professeur de recherche sur l’intelligence artificielle à la Wharton School de l’Université de La Pennsylvanie, a déclaré dans un tweeter lundi.
Les communautés d’IA en ligne se sont déchaînées à propos du chatbot anonyme gpt2. Un utilisateur de X affirme que gpt2-chatbot a presque codé un clone parfait du jeu mobile Flappy Bird. Un autre utilisateur X dit qu’il a résolu un Problème de l’Olympiade internationale de mathématiques d’un seul coup. Sur de longs fils de discussion Reddit, les utilisateurs spéculent énormément sur les origines du chatbot gpt2 et se disputent pour savoir s’il vient de OpenAI, Google, ou AnthropiqueIl n’y a aucune preuve de ces affirmations, mais les tweets du PDG d’OpenAI, Sam Altman, et d’autres dirigeants viennent de mettre de l’huile sur le feu.
Vous pouvez essayer le gpt2-chatbot vous-même à Site Web de LMSYS Org. Accédez à « Direct Chat » ou à « Arena (côte à côte) » et sélectionnez-le dans le menu déroulant. LMSYS Org indique dans son blog politique que certains développeurs de modèles d’IA peuvent tester des modèles anonymes inédits avant une version plus large. Cela a amené beaucoup de gens à croire que gpt2-chatbot est un modèle anonyme d’un développeur majeur d’IA.
« Juste pour clarifier, conformément à notre politique, nous avons établi un partenariat avec plusieurs développeurs de modèles pour apporter leurs nouveaux modèles sur notre plateforme pour un aperçu communautaire. tests », a déclaré LMSYS Org in a tweeter lundi, en réponse à un fil de discussion sur gpt2-chatbot. « Ces modèles sont strictement destinés aux tests et ne seront pas répertoriés dans le classement avant ils deviennent publics.
LMYSYS Org et OpenAI n’ont pas immédiatement répondu à la demande de commentaires de Gizmodo.
Lors des tests limités de Gizmodo, nous avons découvert que le chatbot gpt2 possède des capacités qui sont similaires aux principaux modèles d’IA d’Anthropic et d’OpenAI. un comportement exclusif aux grands modèles de langage avancés, un raisonnement bien et décrit des plans détaillés pour des tâches compliquées. Voici quelques uns de nos exemples comparant gpt2- chatbot (à gauche) et le modèle Claude Opus d’Anthropic (à droite).
Un professeur de génie informatique à l’Université du Wisconsin a découvert que gpt2-chatbot pouvait effectuer une tâche que d’autres modèles d’IA de premier plan ne pouvaient pas. Dimitris Papailiopoulos a demandé à gpt2-chatbot de résoudre une énigme mathématique qui implique l’apprentissage de certaines règles inexplicites. L’IA a en grande partie du mal à répondre à des questions comme celle-ci.
En fin de compte, il y a très peu d’informations disponibles sur le chatbot gpt2 pour l’instant. Cependant, il semble clair qu’un acteur puissant se cache derrière cela. Modèle d’IA. Dans les semaines à venir, le créateur et les origines du chatbot gpt2 deviendront probablement publics. Cela pourrait signifier une nouvelle IA. Un modèle est à l’horizon ou peut-être qu’il y a un nouveau développeur d’IA sur la scène.
Une version de cette histoire est apparue à l’origine sur Gizmodo.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.