OpenAI a présenté Sora, son premier générateur de texte en vidéo, jeudi avec de belles vidéos étonnamment réalistes présentant les capacités du modèle d’IA. Sora est maintenant disponible pour un petit nombre de chercheurs et des créatifs qui testeront le modèle avant une diffusion publique plus large, ce qui pourrait être un désastre pour l’industrie cinématographique et notre problème collectif de deepfake.
“Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis du sujet et de l’arrière-plan”, a déclaré OpenAI dans un article de blog. « Le modèle comprend non seulement ce que l’utilisateur a demandé dans l’invite, mais aussi comment ces choses existent dans le contexte physique. monde.”
OpenAI n’a pas précisé quand Sora sera rendu public.
Sora est la première entreprise d’OpenAI dans la génération de vidéos avec l’IA, en ajoutant au texte et alimenté par l’IA de l’entreprise générateurs d’images, ChatGPT et Dall-E. C’est unique parce que c’est moins un outil de création, et plus un “moteur physique basé sur les données,» comme l’a souligne le Dr. Jim Fan, chercheur principal chez Nvidia. Sora ne génère pas seulement une image, mais il détermine la physique de un objet dans son environnement et restitue une vidéo basée sur ces calculs.
Pour générer des vidéos avec Sora, les utilisateurs peuvent simplement saisir quelques phrases comme invite, un peu comme les générateurs d’images IA. Vous pouvez choisir entre un style photoréaliste et un style animé, produisant des résultats choquants en quelques minutes seulement.
Sora est un modèle de diffusion, ce qui signifie qu’il génère une vidéo en commençant par une vidéo floue et remplie d’électricité statique et en la lissant lentement pour obtenir un rendu poli. versions que vous voyez ci-dessous. Les générateurs d’images et de vidéos de Midjourney et Stable Diffusion sont également des modèles de diffusion.
Cependant, je dois noter que Sora d’OpenAI est bien meilleur. Les vidéos produites par Sora sont plus longues, plus dynamiques et s’enchaînent mieux que concurrents. Sora a l’impression qu’il crée de vraies vidéos, alors que les modèles concurrents ressemblent à un stop motion d’images IA. OpenAI a de nouveau éclaté encore un autre domaine de l’IA avec un générateur vidéo qui fait honte à la concurrence.
Les vidéos produites par Sora sont indéniablement incroyables. Ces vidéos auraient pris des heures à produire par une véritable équipe de tournage ou des animateurs. Sora sera probablement perturbateur pour l’industrie cinématographique de la même manière que ChatGPT et les générateurs d’images IA ont choqué le monde de l’édition et du design. Il s’agit d’une technologie à la fois remarquable et effrayante en termes de sécurité d’emploi pour les créateurs vidéo.
OpenAI indique qu’il y a quelques ajustements à apporter, y compris le fait de ne pas comprendre les causes et les effets. Sora peut générer une vidéo d’un une personne qui mord dans un cookie, mais après, il se peut que le cookie n’ait pas de marque de morsure. OpenAI dit également que le modèle manque conscience spatiale. Cela peut confondre la gauche et la droite et ne pas comprendre comment une personne ou un objet interagit avec une scène.
La sécurité est également une préoccupation primordiale, surtout compte tenu de la manière dont la technologie de l’IA a été utilisée pour créer des deepfakes ces derniers mois. OpenAI affirme qu’il construira des outils pour aider à détecter les contenus trompeurs, ainsi qu’à appliquer les technologies existantes qui rejetent les invites de texte nuisibles. Cependant, étant donné la manière dont les gens ont contourné les protections des modèles d’IA actuels, on peut se demander dans quelle mesure ces efforts seront couronnés de succès.
Sora est aussi impressionnant que terrifiant, et il est clair comment ce puissant générateur vidéo d’IA pourrait perturber l’industrie du film et créer des nuisibles sorties. Imaginez si le Taylor Swift deepfakes étaient des vidéos. Ou et si Joe Biden faux appel téléphonique aux électeurs du New Hampshire était-ce un message photoréaliste du Bureau Ovale ? Sora n’est pas encore disponible au public, mais les implications de cette puissante technologie précèdent son lancement .
Cet article a été initialement publié sur Gizmodo.
Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.