in

Test Midjourney

Nous sommes à l’ère de l’IA. J’ai été surpris la première fois que j’ai utilisé ChatGPT par le réalisme du texte et des réponses, mais j’étais encore plus impressionné par la véritable signification du contenu.

Pour moi, c’était simplement un logiciel de reconnaissance de motifs pour le texte. J’ai aussi essayé Dall-e, mais selon moi, c’était simplement un gadget.

Aujourd’hui, j’ai testé Midjourney, et c’est la première fois que j’ai été impressionné par l’IA ou l’apprentissage automatique. Dans cet article, nous verrons pourquoi vous devriez être enthousiasmé mais aussi préoccupé par cette innovation.

Qu’est-ce que Midjourney ?

Midjourney est essentiellement une IA capable de générer des images et des illustrations originales en utilisant des images existantes ou simplement une suggestion.

Qu’est-ce qu’un prompt ?

Une suggestion est simplement une commande pour générer une image. Pour générer une image, la suggestion commence par /imagine, et le reste peut être librement écrit.

Il faut toujours respecter l’ordre, et être lexicalement correct et facilement compréhensible aidera également.

Comment cela fonctionne-t-il ?

Contrairement à ChatGPT, Midjourney utilise le chat Discord pour enregistrer la suggestion et gérer l’interface utilisateur.

Je dois avouer qu’au début, j’étais réticent à télécharger une application supplémentaire pour l’essayer, mais finalement, cela a du sens car vous pourrez bénéficier d’une courbe d’apprentissage plus rapide grâce aux autres utilisateurs.

Vous devrez également souscrire un abonnement ; auparavant, c’était gratuit, mais générer autant d’images doit être énergivore et coûteux. Vous devrez donc payer au moins 8 ou 10 dollars par mois pour utiliser le service.

Notez que les images générées sont publiques, et tout le monde dans la même salle pourra voir ce que vous essayez de créer. Il y a aussi des règles à suivre pour éviter de créer du contenu virulent.

Est-ce difficile à utiliser ?

Comparé à ChatGPT, je dirais qu’obtenir de bons résultats est un peu plus technique, mais je pense que vous serez rapidement impressionné par les résultats.

La partie la plus difficile pour moi est d’ajuster et de peaufiner les résultats ; vous avez généralement besoin de plus d’un essai, c’est pourquoi ils vous donnent quatre exemples.

Une fois que vous avez vos exemples, vous pouvez soit reformuler votre suggestion, agrandir une image, ou varier l’une des photos jusqu’à ce que vous obteniez quelque chose qui vous plaît.

C’est assez facile à utiliser, même s’il faut d’abord comprendre ce que signifie chaque bouton, vous finirez probablement par vous y habituer car c’est tellement engageant.

Quelques exemples

Beautiful woman Model walking in the stairs of Montmartre Paris, in the style of epic fantasy scenes, dressed with a beige trench coat, canon 5D mark VI, national geographic photo, hyper realistic

Pour ma première suggestion, j’ai essayé de visualiser l’une des prises de vue que mon ami et moi préparons pour une publicité de parfum. Je dois admettre que ce n’était pas très loin de mon imagination.

L’emplacement n’avait pas l’air réel, même s’il donnait une idée juste de l’endroit. Ou bien il a peint la basilique du Sacré-Cœur de Montmartre à l’arrière-plan, mais cela ressemblait à une image composite.

Beautiful asian woman Model walking in place du Trocadero Paris, dressed with a beige trench coat and high heels, Arri Alexa, hyper realistic

Après mes premiers résultats, j’ai essayé d’être plus précis concernant l’origine ethnique du modèle, les chaussures, et les résultats étaient convaincants, mais malgré cela, en raison de ma formulation peu claire, l’ordinateur a généré tous les vêtements en beige. La sémantique est très importante pour obtenir un résultat précis.

Beautiful asian woman Model walking in place du Trocadero Paris at night, in the style of Nicolas Winding Refn, with neons, dressed with a beige trench coat, white shirt, and black high heels, Arri Alexa, hyper realistic

Juste pour m’amuser, j’ai même essayé d’ajouter un style du réalisateur Nicolas Winding Refn dans l’image. Si l’IA a saisi l’idée principale, l’exécution n’était pas très esthétique. Je pense qu’en téléchargeant une image, on obtiendrait de meilleurs résultats.

Handsome Korean actor posing inside an haussmannian appartement in Paris, dressed with a navy double breasted suit. Sitted and drinking a glass of Macallan Whisky at night with a view of the eiffel tower, Arri Alexa, hyper realistic, David Fincher’s style

C’est là que j’ai commencé à m’inquiéter pour mon travail en tant que photographe. Ces images sont très proches de ce que j’imaginais. Je serais même prêt à utiliser ces images car je les trouve de bonne qualité. L’éclairage semble très réaliste et à aucun moment les images ne semblent être des composites de plusieurs photos.

Je ne sais pas si un ordinateur calcule ces choses ou si cela est simplement grandement inspiré du travail de quelqu’un d’autre.

A beautiful Vietnamese woman of 29 years old with pale skin and long dark hair waiting for the bus, she is wearing a thin beige trench coat, with a navy blue dress, gold necklace and ring,  high heel black shoes, wearing a expensive Gucci bag, she is holding a two year old asian baby boy with a self haircut. Behind is the bir hakeim bridge in Paris.

Ma femme a essayé de créer une image, et même si elle n’était pas parfaitement fidèle au prompt, elle était quand même très proche et tout à fait utilisable.

Je trouve que les images ont un super rendu, et je serais heureux si je les avais prises moi-même. Rien que de penser que tout cela a été généré par l’ordinateur est tout simplement incroyable.

Song Hye Kyo laying in a flower field during sunset, surrounded by white, pink, and light purple flowers. She is wearing a dress with flowers.The flower field is located inside the Cour Carré of the Louvre Museum. The image have to fit Louis Vuitton commercial style.

Je voulais pousser les capacités de Midjourney encore plus loin en essayant d’utiliser de vrais noms et de reproduire un concept de Louis Vuitton.

Les images ont donné un très joli résultat. Je suis sincèrement impressionné par la qualité des images que l’on peut obtenir sans avoir à investir dans un décor, des fleurs, des lumières, etc.

Les images ont l’air suffisamment réelles pour être utilisées comme illustrations ; c’est la partie la plus effrayante, car cette technologie est encore assez récente.

Louis Vuitton Commercial

Je pense qu’il est inévitable que ce type de technologie finisse par être intégré dans des programmes comme Unreal Engine 5. À partir de là, c’est juste une course jusqu’à ce que nous ayons une simulation indiscernable de la réalité.

Examples from other users

https://s.mj.run/20XXV64pyrw create movie scenes, by using reference photo, cinematic lighting, movie still, cinematic shot, raw, award winning photograph, Kodak Portra 400, f2. 0, 16mm, contemporary photography, Hasselblad, ultra 8k, Pentax 67, analog grain, --uplight --v 5 --q 2 --s 750 --ar 3:2

Certains utilisateurs ont littéralement créé des images qui ressemblent à des captures d’écran réelles de films. Ces images donnent l’impression de ne pas avoir été générées, mais plutôt composées à partir d’une autre capture d’écran réelle.

Je n’arrive pas à croire que l’IA soit capable de produire quelque chose d’aussi réel et unique.

Ghibli style, a girl, Mountain, forest, --niji --ar 16:9 - @HK (fast)

Un utilisateur a même réussi à produire des captures d’écran d’anime dans le style Ghibli. Je ne sais pas comment l’IA s’y prend, mais il semble qu’elle utilise une base de données d’un véritable anime de Hayao Miyazaki.

Examples using another picture

Photographie originale à copier
Photographie produite par Midjourney
https://imd-human-transition.com/wp-content/uploads/2016/01/blog-lifestyle-6.jpg Man sitting in front of a lake and behind mountains, meditating trying to find inspiration during the summer, in the style of photo realistic, Kodak Portra 400, Mamiya RZ67 --3:2

L’IA a compris le prompt et a réalisé une image parfaitement inspirée avec la même idée en tête. Elle a même utilisé une palette de couleurs similaire. Oubliez les outils de suppression des droits d’auteur ; ceci va bien au-delà de tout ça.

Prendre inspiration d’une publicité existante

Emma Stone pour Louis Vuitton Copyright Louis Vuitton

Pousser le vice un peu plus loin, est-il possible de reproduire une image en ne changeant que le modèle ?

https://s.mj.run/AUJw_5dddfM, beautiful asian model laying in a flower field during sunset, by using reference photo, Kodak Portra 400, Pentax 67, analog grain

The results are very convincing. Perhaps I made the mistake of forgetting the proper ratio written in Ar 3:2. I think this tool could easily be used to storyboard or moodboard a project for a video.

Les limites

Je ne prétends pas savoir comment fonctionne cette technologie. Est-ce qu’elle peint une image à partir de zéro ou compose-t-elle plusieurs images ?

Ma théorie est que c’est plutôt la dernière option. J’ai déjà eu des filigranes sur mes images générées, mais ils n’étaient pas lisibles. Les mots semblaient presque retouchés avec l’outil de tampon dans Photoshop.

Toyota C-HR est reconnaissable mais toujours différentes

Je pense que pour obtenir du contenu de qualité, il faut des idées très spécifiques avec un niveau de détail élevé. Peu importe à quel point vous améliorez votre prompt, s’il y a trop de détails, il sera difficile pour l’IA de produire l’image.

Midjourney ne semble pas vraiment connaître les lieux ; par exemple, si vous recherchez un endroit spécifique à Paris, il pourrait mélanger des lieux et les monuments ne semblent jamais authentiques. Presque comme s’ils avaient une règle de violation de copyright. Il en va de même pour les personnes et les objets. Vous pouvez toujours les reconnaître, mais il y a quelques légères différences qui les rendent originaux.

mads mikkelsen as a russian aristocrat hunting in the jungle posing as a portrait looking at the camera in a menacing look with a gun --ar 16:9

Les problèmes

Regardez les mains des personnes pour voir les défauts

Le problème avec Midjourney est que dès que vous regardez attentivement une image, vous trouverez des erreurs de composition. Par exemple, une personne peut manquer un doigt ou une jambe, une lumière peut flotter dans l’air, ou il peut y avoir quelque chose qui ne correspond pas ou n’a aucun sens dans l’image.

Ces petites erreurs sont très difficiles à dissimuler ou à retoucher avec Photoshop également.

Verdict

8,5 sur 10.

Je pense que Midjourney en est enfin arrivé au point où l’IA devient une menace pour les artistes. Cela impactera certainement le marché des images libres de droits dans un avenir proche.

Pour 8 dollars par mois, vous pouvez générer des centaines d’images originales à utiliser sur votre site web comme illustrations. Pour l’instant, les images semblent un peu génériques et vagues pour un contenu spécifique, elles ont encore des problèmes avec les doigts et les détails, mais cela ne représente que les premières étapes du produit.

Je suis encore un peu choqué par ce que cette technologie peut accomplir et ce qu’elle pourrait signifier pour les photographes ou les illustrateurs. Bien sûr, il est actuellement presque impossible de reproduire une personne existante, car l’IA a probablement des règles éthiques enregistrées dans son système.

De plus, le niveau de précision n’est pas suffisant pour des projets réels qui tiennent compte des petits détails. Il est impossible de fournir une instruction précise sans avoir une anomalie dans l’image. Nous verrons comment cette technologie évolue, mais il semble plus que réaliste que d’ici moins d’une décennie, elle aura fait des progrès fulgurants au point d’être utilisée dans la plupart des scénarios.

Informations

Midjourney

Site Internet : https://www.midjourney.com/

Discord Midjourney : https://discord.com/invite/midjourney

Discord : https://discord.com

Production audiovisuelle Paris : https://www.neonnight.fr

What do you think?

Written by dudeoi

Laisser un commentaire

GIPHY App Key not set. Please check settings