Une startup d’IA soutenue par Nvidia a présenté sa prochaine génération d’avatars d’IA qui peuvent comprendre le contexte à partir des entrées de texte et exprimer des émotions humaines, comme le bonheur, la tristesse et l’excitation.
Synthesia, une entreprise basée à Londres, a déclaré que sa quatrième génération de « avatars expressifs” sont alimentés par un modèle formé « à comprendre la relation complexe entre ce que nous disons et comment nous le disons. Les avatars peuvent suivre des scripts comme de vrais acteurs en utilisant le bon ton de voix, le langage corporel et la synchronisation labiale, a déclaré la société.
« Avec ces nouveaux avatars, nous ne créons pas seulement des rendus numériques ; nous introduisons des acteurs numériques », a écrit Synthesia dans un article de blog. « Cette technologie apporte un niveau de sophistication et de réalisme aux avatars numériques qui brouille la ligne entre le virtuel et le réel.” Le Les avatars sont alimentés par le modèle EXPRESS-1 de Synthesia, qui est formé pour prédire les mouvements (comme le clignement des yeux) et les expressions faciales (comme le sourire). correspondre au ton de l’avatar, ce qui se traduit par des interactions plus humaines.
L’entreprise, fondée en 2017 par une équipe de chercheurs en IA et d’entrepreneurs, se concentre sur la production vidéo sans caméras, microphones ou studios. Les avatars de Synthesia ont été utilisés par des entreprises pour réaliser des présentations et des vidéos de formation, indique-t-on.
Synthesia a déclaré que certains types de contenu seront restreints pour éviter toute utilisation abusive par des acteurs de mauvaise foi, en particulier dans le contexte des prochaines élections présidentielles américaines. dans un autre article de blog, Synthesia a souligné comment L’IA a été utilisée se propager désinformation et désinformation, et comment ses avatars peuvent spécifiquement être utilisés pour ressembler à la voix et à la ressemblance d’une vraie personne.
Les 225 avatars existants de l’entreprise ont été utilisés par plus de 200 000 personnes pour générer plus de 18 millions de présentations vidéo dans plus de 130 langues. a dit. La synthèse sert également plus de 55 000 entreprises dans le monde , dont la moitié du Fortune 100.
En juin dernier, Synthesia a annoncé qu’elle avait a levé 90 millions de dollars lors d’un tour de financement de série C qui comprenait le leader des puces Nvidia. Le tour, qui a mené l’entreprise à une valorisation d’un milliard de dollars, a été dirigé par la société de capital-risque Accel, qui était également un investisseur. sur Facebook et Spotify.
« La productivité peut être améliorée parce que vous réduisez le coût de production de la vidéo à celui de la création d’un PowerPoint », Philippe Botteri, investisseur chez Accel, a déclaré à CNBC en juin. « La vidéo est un bien meilleur moyen de communiquer des l’entreprise et la valorisation, nous réfléchissons à ce qu’elle peut rapporter, [et] dans le cas de Synthesia, nous ne faisons que gratter le surface. »
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.