OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités

OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités

Nos partenaires chez Gizmodo ont testé la nouvelle fonctionnalité d’édition de DALL-E et ont découvert qu’elle ne remplacera pas Photoshop encore

Nous pouvons gagner une commission sur les liens sur cette page.
Lancer le diaporama
Lancer le diaporama
Image générée par l’IA d’un grimpeur escaladant la Statue de la Liberté.
Image générée par l’IA d’un grimpeur escaladant la Statue de la Liberté.
Image: OpenAI DALL-E

OpenAI confronté à un problème commun pour Générateurs d’images IA quand il a largement diffusé un nouvelle fonctionnalité d’édition pour ChatGPT DALL-E ce mois. Souvent, les générateurs d’images d’IA comprennent mal ce que vous voulez créer, donc le nouvel outil d’OpenAI vous permet de mettre image et modifiez-les selon vos spécifications. L’outil semble génial en théorie, mais en pratique, il laisse quelque chose à désirer.

Publicité

Gizmodo a exécuté quelques tests du nouvel outil d’édition de DALL-E, qui est très similaire à Fonctionnalité de remplissage génératif d’Adobe Photoshop, Firefly. Bien que le DALL-E d’OpenAI soit l’un des meilleurs générateurs d’images IA du marché, l’outil d’édition est quelque peu décevant. Idéalement , un outil de retouche photo devrait vous permettre de modifier les éléments qui ne vont pas dans une image. Nous avons largement constaté que l’édition de DALL-E L’outil refuse ou ne parvient tout simplement pas à produire ce que vous demandez. Dans certains cas, il gâche complètement la photo.

L’outil met en évidence un facteur limitant clé pour les générateurs d’images IA : ils n’ont aucune idée de ce qu’ils font. À un moment donné lors de l’utilisation de la fonction d’édition de DALL-E, ChatGPT m’a dit : “Malheureusement, je ne peux pas directement éditer les images ni modifier des éléments spécifiques qu’elles contiennent." C’est parce que l’IA ne sait pas ce qu’elle a fait. Elle ne peut pas dire s’il y a un premier plan, un arrière-plan, ou même quel signez-le créé, dit.

Ainsi, la fonction d’édition ne consiste pas vraiment à "éditer” la photo. Il s’agit en fait de modifier votre invite et de générer une nouvelle photo à chaque fois. temps dans la zone que vous spécifiez. Le résultat est que la fonction d’édition de DALL-E ne vous permet pas la précision et le contrôle que vous auriez attendre d’un outil d’édition.

Vous devez comprendre les limites de DALL-E afin d’utiliser l’outil d’édition. Pour en tirer le meilleur parti, vous avez vraiment besoin utiliser des instructions claires et ne demander que des changements assez simples. Mettre un chapeau d’anniversaire sur quelqu’un, faire passer une scène du jour au soir, ou d’autres changements simples ont généralement fonctionné dans nos tests, bien que des changements plus compliqués n’aient pas fonctionné.

Pour être juste, c’est le cas pour tous les outils d’édition sur les générateurs d’images IA en ce moment. Ils génèrent quelque chose de nouveau chacun. temps, et cela peut déformer votre image. Bien que l’éditeur fonctionne dans des circonstances limitées, il n’offre pas la personnalisation que vous pourriez espérer. . Voici nos tests avec l’éditeur d’images de DALL-E.

Publicité
Diapositive précédente
Diapositive suivante

2 / 11

Joyeux 3ème anniversaire

Joyeux 3ème anniversaire

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Pour notre première tentative, nous avons essayé de créer « une image d’un enfant soufflant des bougies d’anniversaire avec un panneau indiquant « Joyeux 3e anniversaire ». .'” Le résultat a été une plutôt bonne image — DALL-E est toujours l’un des meilleurs générateurs d’images d’IA. Cependant, le signe en arrière-plan est mal orthographié, un problème courant pour l’IA. Lorsque nous avons essayé de le modifier, DALL-E a révélé ses limites.

Publicité

« Malheureusement, je ne peux pas directement éditer les images ni modifier des éléments spécifiques qu’elles contiennent. Cependant, je peux créer une nouvelle image basée sur des images révisées. spécifications. Si vous le souhaitez, vous pouvez décrire tout changement supplémentaire ou confirmer que vous souhaitez une nouvelle image similaire à la précédente, », a déclaré ChatGPT en réponse à notre demande de réparation du panneau.

DALL-E ne peut pas vraiment éditer, il ne peut que produire de nouvelles images similaires à votre dernière image. Nous avons abandonné cette tentative et sommes passés à autre chose. à un autre.

Publicité
Diapositive précédente
Diapositive suivante

3 / 11

Robot Interviewant Tech Bros

Robot Interviewant Tech Bros

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Ici, nous avons demandé « une image d’un robot reporter interrogeant des dirigeants de grandes technologies devant le pont du golden gate à San Francisco. ” Encore une fois, DALL-E a produit une première image assez forte. Cependant, nous avons pensé que le robot était un peu trop gros, alors voyez comment fonctionne la fonction d’édition.

Publicité
Diapositive précédente
Diapositive suivante

4 / 11

Rendre le robot plus petit

Rendre le robot plus petit

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

DALL-E a réussi à rendre le robot plus petit, mais il lui a enlevé la tête et a rendu les bras vraiment courts. Alors réessayons. a demandé à DALL-E de remettre sa tête en arrière et de donner au robot des bras plus longs. Nous avons également demandé des écouteurs sur le robot.

Publicité
Diapositive précédente
Diapositive suivante

5 / 11

Donnez au robot une tête et des bras plus longs

Donnez au robot une tête et des bras plus longs

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

D’accord, nous avons des bras plus longs et une tête, mais pas d’écouteurs et nous avons toujours perdu notre microphone. Le robot semble être moins intelligent. un journaliste maintenant et plus un maestro, mais peu importe, c’est bien. Ensuite, nous avons demandé à DALL-E de mettre des podiums devant nos responsables techniques, mais cela n’a pas été fait. Nous avons donc demandé à la place une grande table avec des papiers et des microphones.

Publicité
Diapositive précédente
Diapositive suivante

6 / 11

Offrez une table à nos responsables technologiques

Offrez une table à nos responsables technologiques

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Donc DALL-E n’a pas réussi à nous donner des podiums, et je dirais que cette table ne fonctionne pas vraiment non plus. Oui, c’est une table, mais ce n’est pas celui qui fonctionne avec le réglage. De plus, il n’y a pas de papier ni de microphone dessus. DALL-E en est également devenu un. des mains du cadre en métal et des papiers dans sa main. Enfin, nous avons demandé à DALL-E de transformer les gens de l’arrière-plan en canards. et faites-en une journée enneigée.

Publicité
Diapositive précédente
Diapositive suivante

7 / 11

Transformez les gens de l’arrière-plan en canards et ajoutez de la neige

Transformez les gens de l’arrière-plan en canards et ajoutez de la neige

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Comme vous pouvez le constater, trop de modifications peuvent briser l’image entière. Nous avons mis en évidence les personnes en arrière-plan et leur avons demandé de les transformer en images. canards. Cependant, DALL-E ne peut pas différencier le premier plan et l’arrière-plan, même lorsque vous n’avez sélectionné que l’arrière-plan. Et lorsque nous avons sélectionné le tout l’écran pour ajouter de la neige, cela a complètement changé l’image et a cassé notre travail. Nous nous sommes arrêtés ici, réalisant que cette image était désormais inutilisable. .

Publicité
Diapositive précédente
Diapositive suivante

8 / 11

Un grimpeur escaladant la Statue de la Liberté

Un grimpeur escaladant la Statue de la Liberté

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Pour notre test dernier, nous avons demandé à DALL-E de créer « un grimpeur qui escalade la statue de la liberté », et honnêtement ce est le résultat génial. Pour notre première édition, nous avons demandé à DALL-E de changer l’expression de la statue en un sourire et d’ajouter un chapeau d’anniversaire à notre grimpeur.

Publicité
Diapositive précédente
Diapositive suivante

9 / 11

Elle sourit et c’est son anniversaire

Elle sourit et c’est son anniversaire

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Lady Liberty sourit à sa ville, et nous avons avec succès ajouté une couronne d’anniversaire à notre grimpeur. Ensuite, nous avons demandé de tourner le scène dans un décor nocturne, ajoutez des feux d’artifice en arrière-plan et lancez un deuxième grimpeur dans la scène.

Publicité
Diapositive précédente
Diapositive suivante

10 / 11

Un feu d’artifice, mais pas de deuxième grimpeur

Un feu d’artifice, mais pas de deuxième grimpeur

Image de l'article intitulé OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités
Image: OpenAI DALL-E

Le ciel nocturne et les feux d’artifice ont été brillamment ajoutés à notre image. Cependant, nous avons continuellement demandé à DALL-E d’ajouter un deuxième grimpeur à l’image, mais cela s’est avéré trop important pour l’outil d’édition.

Publicité

Bien qu’il s’agisse de notre test le plus réussi avec l’éditeur d’images, chaque test que nous avons effectué avec DALL-E a connu de nombreux revers. S’améliorer au fil du temps ? Probablement, mais qui sait si cela changera véritablement la donne en tant qu’éditeur d’images.

Une version de cet article paru à l’origine sur Gizmodo.

Ce contenu a été traduit automatiquement à partir du texte original. De légères différences résultant de la traduction automatique peuvent apparaître. Pour la version originale, cliquez ici.

Publicité