Logo

OpenAI a offert à DALL-E une fonctionnalité d’édition qui montre comment les générateurs d’images IA sont limités

Nos partenaires chez Gizmodo ont testé la nouvelle fonctionnalité d’édition de DALL-E et ont découvert qu’elle ne remplacera pas Photoshop encore

OpenAI confronté à un problème commun pour Générateurs d’images IA quand il a largement diffusé un nouvelle fonctionnalité d’édition pour ChatGPT DALL-E ce mois. Souvent, les générateurs d’images d’IA comprennent mal ce que vous voulez créer, donc le nouvel outil d’OpenAI vous permet de mettre image et modifiez-les selon vos spécifications. L’outil semble génial en théorie, mais en pratique, il laisse quelque chose à désirer.

Gizmodo a exécuté quelques tests du nouvel outil d’édition de DALL-E, qui est très similaire à Fonctionnalité de remplissage génératif d’Adobe Photoshop, Firefly. Bien que le DALL-E d’OpenAI soit l’un des meilleurs générateurs d’images IA du marché, l’outil d’édition est quelque peu décevant. Idéalement , un outil de retouche photo devrait vous permettre de modifier les éléments qui ne vont pas dans une image. Nous avons largement constaté que l’édition de DALL-E L’outil refuse ou ne parvient tout simplement pas à produire ce que vous demandez. Dans certains cas, il gâche complètement la photo.

L’outil met en évidence un facteur limitant clé pour les générateurs d’images IA : ils n’ont aucune idée de ce qu’ils font. À un moment donné lors de l’utilisation de la fonction d’édition de DALL-E, ChatGPT m’a dit : “Malheureusement, je ne peux pas directement éditer les images ni modifier des éléments spécifiques qu’elles contiennent." C’est parce que l’IA ne sait pas ce qu’elle a fait. Elle ne peut pas dire s’il y a un premier plan, un arrière-plan, ou même quel signez-le créé, dit.

Ainsi, la fonction d’édition ne consiste pas vraiment à "éditer” la photo. Il s’agit en fait de modifier votre invite et de générer une nouvelle photo à chaque fois. temps dans la zone que vous spécifiez. Le résultat est que la fonction d’édition de DALL-E ne vous permet pas la précision et le contrôle que vous auriez attendre d’un outil d’édition.

Vous devez comprendre les limites de DALL-E afin d’utiliser l’outil d’édition. Pour en tirer le meilleur parti, vous avez vraiment besoin utiliser des instructions claires et ne demander que des changements assez simples. Mettre un chapeau d’anniversaire sur quelqu’un, faire passer une scène du jour au soir, ou d’autres changements simples ont généralement fonctionné dans nos tests, bien que des changements plus compliqués n’aient pas fonctionné.

Pour être juste, c’est le cas pour tous les outils d’édition sur les générateurs d’images IA en ce moment. Ils génèrent quelque chose de nouveau chacun. temps, et cela peut déformer votre image. Bien que l’éditeur fonctionne dans des circonstances limitées, il n’offre pas la personnalisation que vous pourriez espérer. . Voici nos tests avec l’éditeur d’images de DALL-E.

2 / 10

Joyeux 3ème anniversaire

Pour notre première tentative, nous avons essayé de créer « une image d’un enfant soufflant des bougies d’anniversaire avec un panneau indiquant « Joyeux 3e anniversaire ». .'” Le résultat a été une plutôt bonne image — DALL-E est toujours l’un des meilleurs générateurs d’images d’IA. Cependant, le signe en arrière-plan est mal orthographié, un problème courant pour l’IA. Lorsque nous avons essayé de le modifier, DALL-E a révélé ses limites.

« Malheureusement, je ne peux pas directement éditer les images ni modifier des éléments spécifiques qu’elles contiennent. Cependant, je peux créer une nouvelle image basée sur des images révisées. spécifications. Si vous le souhaitez, vous pouvez décrire tout changement supplémentaire ou confirmer que vous souhaitez une nouvelle image similaire à la précédente, », a déclaré ChatGPT en réponse à notre demande de réparation du panneau.

DALL-E ne peut pas vraiment éditer, il ne peut que produire de nouvelles images similaires à votre dernière image. Nous avons abandonné cette tentative et sommes passés à autre chose. à un autre.

3 / 10

Robot Interviewant Tech Bros

Ici, nous avons demandé « une image d’un robot reporter interrogeant des dirigeants de grandes technologies devant le pont du golden gate à San Francisco. ” Encore une fois, DALL-E a produit une première image assez forte. Cependant, nous avons pensé que le robot était un peu trop gros, alors voyez comment fonctionne la fonction d’édition.

4 / 10

Rendre le robot plus petit

DALL-E a réussi à rendre le robot plus petit, mais il lui a enlevé la tête et a rendu les bras vraiment courts. Alors réessayons. a demandé à DALL-E de remettre sa tête en arrière et de donner au robot des bras plus longs. Nous avons également demandé des écouteurs sur le robot.

5 / 10

Donnez au robot une tête et des bras plus longs

D’accord, nous avons des bras plus longs et une tête, mais pas d’écouteurs et nous avons toujours perdu notre microphone. Le robot semble être moins intelligent. un journaliste maintenant et plus un maestro, mais peu importe, c’est bien. Ensuite, nous avons demandé à DALL-E de mettre des podiums devant nos responsables techniques, mais cela n’a pas été fait. Nous avons donc demandé à la place une grande table avec des papiers et des microphones.

6 / 10

Offrez une table à nos responsables technologiques

Donc DALL-E n’a pas réussi à nous donner des podiums, et je dirais que cette table ne fonctionne pas vraiment non plus. Oui, c’est une table, mais ce n’est pas celui qui fonctionne avec le réglage. De plus, il n’y a pas de papier ni de microphone dessus. DALL-E en est également devenu un. des mains du cadre en métal et des papiers dans sa main. Enfin, nous avons demandé à DALL-E de transformer les gens de l’arrière-plan en canards. et faites-en une journée enneigée.

7 / 10

Transformez les gens de l’arrière-plan en canards et ajoutez de la neige

Comme vous pouvez le constater, trop de modifications peuvent briser l’image entière. Nous avons mis en évidence les personnes en arrière-plan et leur avons demandé de les transformer en images. canards. Cependant, DALL-E ne peut pas différencier le premier plan et l’arrière-plan, même lorsque vous n’avez sélectionné que l’arrière-plan. Et lorsque nous avons sélectionné le tout l’écran pour ajouter de la neige, cela a complètement changé l’image et a cassé notre travail. Nous nous sommes arrêtés ici, réalisant que cette image était désormais inutilisable. .

8 / 10

Un grimpeur escaladant la Statue de la Liberté

Pour notre test dernier, nous avons demandé à DALL-E de créer « un grimpeur qui escalade la statue de la liberté », et honnêtement ce est le résultat génial. Pour notre première édition, nous avons demandé à DALL-E de changer l’expression de la statue en un sourire et d’ajouter un chapeau d’anniversaire à notre grimpeur.

9 / 10

Elle sourit et c’est son anniversaire

Lady Liberty sourit à sa ville, et nous avons avec succès ajouté une couronne d’anniversaire à notre grimpeur. Ensuite, nous avons demandé de tourner le scène dans un décor nocturne, ajoutez des feux d’artifice en arrière-plan et lancez un deuxième grimpeur dans la scène.

10 / 10

Un feu d’artifice, mais pas de deuxième grimpeur

Le ciel nocturne et les feux d’artifice ont été brillamment ajoutés à notre image. Cependant, nous avons continuellement demandé à DALL-E d’ajouter un deuxième grimpeur à l’image, mais cela s’est avéré trop important pour l’outil d’édition.

Bien qu’il s’agisse de notre test le plus réussi avec l’éditeur d’images, chaque test que nous avons effectué avec DALL-E a connu de nombreux revers. S’améliorer au fil du temps ? Probablement, mais qui sait si cela changera véritablement la donne en tant qu’éditeur d’images.

Une version de cet article paru à l’origine sur Gizmodo.