D’anciens métascientifiques ont dévoilé un modèle capable de générer des protéines de la même manière que les chatbots peuvent générer des mots.
EvolutionaryScale, fondé par une équipe d’ex-méta-chercheurs qui travaillaient sur des modèles d’intelligence artificielle pour la biologie, a annoncé son modèle de langage protéique, ESM3, en juin, qui est « le premier modèle génératif pour la biologie qui raisonne simultanément sur la séquence, la structure et la fonction de protéines. »ESM3 est formé sur la séquence, la structure et la fonction de plus de 2,7 milliards de protéines et peut générer de nouvelles protéines en suivant les invites.
«Nous voulons créer des outils qui peuvent rendre la biologie programmable», Alexander Rives, scientifique en chef à EvolutionaryScale et ancien responsable de L’équipe IA des protéines de Meta», dit à Nature.
En juin, EvolutionaryScale a annoncé qu’il avait levé 142 millions de dollars lors d’un tour de table, comptant Lux Capital, Amazon Web Services, Nat Friedman, Daniel Gross, et la branche de capital-risque Nvidia NVentures comme investisseurs. Co-fondateur de Lux Capital et associé gérant Josh Wolfe a déclaré à Reuters l’entreprise est un « moment ChatGPT pour la biologie. »
Chez Meta, Rives et son équipe ont créé un base de données de plus de 600 millions de structures protéiques qui pourraient être utilisés pour le développement de médicaments. Là, ils avaient développé des versions antérieures du modèle ESM, y compris ESMFold, qui a formé un grand nombre de modèle de langage sur des données biologiques pour générer des prédictions des structures protéiques. L’équipe a été supprimée en 2023 au cours de ce que le directeur général de Meta Mark Zuckerberg a qualifié « l’année de l’efficacité » se concentrer sur les produits commerciaux d’IA.
La société a également annoncé un nouveau document, en avant-première, montrant qu’elle avait a incité ESM3 à générer de nouvelles protéines fluorescentes vertes, ou GFP, avec une séquence « qui est seulement à 58 % similaire à la protéine fluorescente connue la plus proche, ou aux protéines responsables de la comment les méduses et les coraux brillent. « D’après le taux de diversification des GFP trouvés dans la nature, nous estimons que cette génération d’un nouveau fluorescent la protéine équivaut à simuler plus de 500 millions d’années d’évolution », a déclaré EvolutionaryScale.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.