Microsoft serait former son propre modèle d’intelligence artificielle pour concourir aux modèles de Google et OpenAI, dont il dispose un partenariat pluriannuel et de plusieurs milliards de dollars avec.
Le nouveau modèle interne du géant de la technologie, appelé en interne MAI-1, est dirigé par l’ancien chef de l’IA de Google, Mustafa Suleyman, L’information rapportée, citant des personnes familières avec le affaire. Microsoft embauché Suleyman, qui a co-fondé les startups d’IA DeepMind (acquises par Google en 2014) et Inflection, qu’il a dirigé en tant que directeur général , pour diriger sa division IA en mars, avec une majorité du personnel d’Inflection. La société a également payé 650 millions de $pour les droits de propriété intellectuelle d’Inflection. Mais Le nouveau modèle est distinct des modèles précédemment publiés par Inflection, ont déclaré des personnes à The Information. Cependant, le nouveau modèle de Microsoft peut être construit à partir de Les données d’entraînement d’Inflection et d’autres technologies, a rapporté The Information.
Microsoft a refusé de commenter le rapport.
Kevin Scott, directeur de la technologie chez Microsoft, a écrit dans un post sur LinkedIn l’entreprise construit « de gros superordinateurs pour former des modèles d’IA » et qu’OpenAI « utilise ces supercalculateurs pour former des modèles qui définissent les frontières ».
« Chaque supercalculateur que nous construisons pour Open AI est beaucoup plus grand que celui qui l’a précédé, et chaque modèle frontalier qu’ils entraînent est beaucoup plus puissant que ses prédécesseurs », a écrit Scott. « Nous continuerons à être sur cette voie en construisant un superordinateur de plus en plus puissant pour Ouvrir l’IA pour entraîner les modèles qui définiront le temps pour l’ensemble du domaine — dans l’avenir . »Scott a ajouté que Microsoft a construit des modèles d’IA pendant des années, et certains des « modèles » portent des noms comme Turing et MAI.
MAI-1 sera coûteux car il nécessitera de grandes quantités de puissance de calcul et de données de formation, car il sera “beaucoup plus grand” que le Des modèles plus petits et open source que Microsoft a formés, ont déclaré des gens à The Information. Par rapport aux modèles open source de Meta et Mistral, qui ont 70 des milliards de paramètres, ou les variables que les modèles apprennent pendant la formation faire des prédictions — MAI-1 aurait environ 500 milliards de paramètres. Le modèle le plus puissant d’OpenAI, GPT-4, aurait plus d’un billion de paramètres.
Microsoft pourrait présenter le modèle lors de sa conférence annuelle des développeurs, Build, plus tard ce mois-ci, a rapporté The Information. un cluster de serveurs comprenant des GPU ou des unités de traitement graphique de Nvidia, ainsi que de grandes quantités de données pour entraîner le modèle, a-t-il ajouté. .
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.