Ce n’est un secret que Gemini , le chatbot IA phare de Google, a rencontré quelques problèmes. production d’images historiquement inexactes a forcé Alphabet, le parent de Google, à suspendre temporairement le produit plus tôt cette année.
Mais Google essaie de tourner la page sur ses premiers mésaventures en matière d’IA. Conférenciers principaux lors de l’édition annuelle du géant de la technologie Google Cloud Prochaine conférence à Las Vegas Mardi, nous avons présenté les nouvelles fonctionnalités de Gemini Pro 1.5, la dernière version de son chatbot qui est désormais accessible au public. Les spectateurs ont regardé pendant que les manifestants se sont murmurés et ont tapé des invites dans le chatbot IA remanié pour mettre en évidence ses nouveaux outils, dont le plus important est peut-être son capacité à « mettre à la terre » les requêtes. la société a déclaré mardi.
Les annonces concernant Gemini 1.5 Pro comprenaient une série de mises à jour du chatbot dans le cadre des efforts de Google pour vendre ses produits d’IA à clients d’entreprise. Gemini inclut désormais des capacités supplémentaires pour quelque chose appelé « compréhension du contexte long », ce qui signifie essentiellement qu’il peut traiter beaucoup plus d’informations. Et il possède des capacités multimodales, ou la capacité de traiter non seulement du texte, mais aussi de l’audio, de la vidéo et d’autres formats pour générer des réponses. .
«Grâce à ces deux avancées, les entreprises peuvent faire aujourd’hui des choses qui n’étaient tout simplement pas possibles avec l’IA auparavant», a déclaré Sundar Pichai, PDG de Google, lors de l’événement. la présentation.
Les entreprises ont déjà testé le produit. Goldman Sachs, Mercedes et Uber sont parmi les premiers clients de Gemini 1.5 Pro , a déclaré Google. Le PDG de Goldman Sachs David Solomon lui-même a une apparition par vidéo sur Google Next juste après Pichai. Ola Källenius, PDG de Mercedes-Benz, a également parlé du partenariat du constructeur automobile allemand avec Google et l’utilisation de ses produits d’IA.
Google a déclaré que Gemini 1.5 Pro permet aux clients de « traiter de grandes quantités d’informations dans un seul flux », y compris 1 heure de vidéo, 11 heures d’audio, soit plus de 700 000 mots.
« Par exemple », a ajouté la société, une société de jeux pourrait fournir une analyse vidéo de la performance d’un joueur, ainsi que des conseils pour l’améliorer. Ou bien, une compagnie d’assurance pourrait combiner des entrées vidéo, des images et du texte pour créer un rapport d’incident, ce qui faciliterait le processus de réclamation.
Google a également d’autres annonces sur l’IA, dont une liste complète peut être trouvée sur le site de la conférence Google Next 2024.
Google Vidéos
Google lance une application de création de vidéos alimentée par l’IA, Google Vidéos. L’application a été présentée par Aparna Pappu, vice-président de Google Workspace mardi.
“Gemini suggère un plan narratif pour l’histoire que je pourrais facilement personnaliser et modifier”, a déclaré sur la base d’une invite dans Google Docs. Pappu.
Génération de texte en images en direct
La dernière version de Google de son générateur d’IA, Imagen 2.0, qui est alimenté par Gemini, a la capacité de créer des images en direct à partir d’invites de texte. . Il est toujours en mode « aperçu », mais des intervenants principaux à Las Vegas ont montré la fonctionnalité.
« Les équipes marketing et créatives peuvent générer des images animées à partir d’une invite de texte, y compris des images de produits, des publicités, des GIF et des storyboards », a déclaré Pappu. Un autre manifestant a souligné que l’outil crée des images en direct qui, autrement, prendraient « des jours ou des semaines de repérage et de prise de vue ».
Pappu a également annoncé que les images Imagen générées par l’IA de Google auront la possibilité d’être filigranées à l’aide du SynthID de Google DeepMind.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.