Dans cet article je vais vous présenter l’étendue des possibilités en combinant les styles de référence (random et image) et les personnalisations de modèle.
Nous allons voir comment en partant d’un prompt extrêmement simple d’un seul mot on peut arriver à un rendu final travaillé et exploitable professionnellement.
Cela va nous permettre, étape par étape, de voir comment utiliser ses paramètres et en exploiter tout leur potentiel.
Style de référence aléatoire (sref random)
Après les Styles de Référence (sref) injectés à partir d’une image, Midjourney propose depuis fin avril d’utiliser des styles aléatoires (--sref random
).
Lorsque vous utilisez ce paramètre le bot vous renvoie un code de style aléatoire que vous allez pouvoir réutiliser. Avec près de 4,3 Millions de styles possibles, beaucoup de base de données qui référencent ces codes ont vu le jour. Depuis peu, il est aussi possible de les combiner et de pondérer leur influence individuellement de la même façon que les styles de référence infusés à partir d’image (à la différence que la pondération des sref random fonctionne elle sur le site web).
Vous pouvez aussi découvrir de nouveaux styles en les combinant: --sref
random random random ou --sref
code1 code2 code3.
Suivant la façon dont vous allez utilisé ces codes de styles aléatoires, ils vont agir de façon très différentes, en fonction de votre prompt, du poids que vous donnez au style (--sw
et pondération “::”) et de la force du stylize (--s
0-1000). Donc ne négligez pas le potentiel d’un style aléatoire même si il vous semble un peu bizarre au départ.
À savoir aussi que le sref a vu plusieurs améliorations et midjourney permet d’utiliser les 4 différentes versions disponibles à ce jour avec le paramètre --sv
(1 à 4) (”sv” pour style versioning).
Je ne m’attarde pas plus longuement sur les sref random, dans la mesure ou j’ai déjà écris deux articles sur le sujet que je vous invite vivement à aller lire.
J’ajuste ensuite en faisant plusieurs test, la pondération de chacun des styles, et je joue avec le poids global du style (style weight = sw) ainsi que le stylize (s).
cocktail
--ar
1:1--style
raw--sref
2140267253::3 3721818712::4 1833276508::1--sw
450--s
550
⚠️ Aux dernières nouvelles les codes sref random ne seront pas accessibles sur la v7 qui devrait voir arriver une nouvelle fonctionnalité plus poussée, mais cela peut encore changer d’ici là, en tout cas ils seront toujours utilisables sur la V6 à l’instar des tuner de styles de la v5.2.
Personnalisation de modèle
La dernière grosse nouveauté est la personnalisation de modèle. Pour vous expliquer succinctement, lorsque vous envoyez un prompt court à Midjourney, l’IA se charge de remplir les vides grace au Stylize avec une esthétique globale propre à midjourney.
La personnalisation de modèle remplace cette esthétique et permet de combler ces vides avec une esthétique qui va correspondre à vos préférences par le biais d’évaluations (sur la page de « ranking ») et de like d’images midjourney (sur la page d’exploration). Personnellement je préfère les like ❤️ que l’on peut annuler, alors que le ranking est pour l’instant définitif. Si vous faites du ranking n’hésitez pas à « skip » (passer) si aucune des deux images ne vous plait vraiment ou si le choix est difficile, pour être sur de construire un modèle qui correspond à ce que vous aimez.
Lorsque vous utilisez la personnalisation de modèle (--p
), le stylise (--s
0 à 1000) va venir jouer sur sa force.
Si vous ne précisez rien, le paramètre --p
appellera votre modèle personnalisé et ajoutera votre code personnel au prompt, vous pouvez partager votre code et donc aussi évidement utiliser ceux des autres en précisant le ou les codes après le --p
.
Plus le prompt est court et moins midjourney a d’informations, plus le stylize et donc la force de l’esthétique liée à votre modèle va avoir d’influence dans le rendu final.
Voici 4 exemples de personnalisation de modèle avec notre prompt: cocktail --p
(les 4 styles présentés ici sont issus de membres de la communauté GenIArt qui était présent avec moi lors du live sur twitch, à savoir dans l’ordre moi même, MathisYannis, Sjeje42 et Deborah).
Voici les résultats en mixant ces 4 personnalisations de modèle puis en gérant leurs influences individuelles:
Les personnalisations de modèle ne sont pas figées et vont évoluer avec le temps au fil des évaluations de chacun des utilisateurs. Cependant comme je l’avais suggéré lors des Office Hours du 26 juin, David Holz a évoqué le 3 juillet, l’idée d’avoir plusieurs versions de la personnalisation de modèle (c’est à dire de pouvoir les sauvegarder à un instant T) .
J’y rajoute ensuite mes sref random codes présentés précédemment que je pondère de la même façon.
Le paramètre --sw
(style weight) joue sur l’influence globale du style de référence tandis que les pondérations (::) définissent la force individuelle de chacun d’entre eux.
Sachez que les pondérations sont des poids relatifs, c’est à dire que si j’ai […]::1 […]::2 […]::3 […]::4, cela fait 1+2+3+4=10 =100% du poids dans ce cas précis il est facile de calculer l’influence, mais sinon il suffit de faire le calcul:
(100 / total des poids) x poids individuel = % de l’influence du style
Ainsi si j’ai […]::4 […]::7 […]::3 […]::5, total des poids = 4+7+3+5 = 19, on a donc pour le poids 1 (100/19)x4 = 21%, poids 2 (100/19)x7 =37%, etc
Evidemment il est important de faire différents tests de rendus au fur et à mesure pour bien ajuster les pondérations. C’est aussi pour cela que je teste mes différents styles de référence et personnalisations de modèle individuellement dans leur état d’origine pour pouvoir identifier l’influence qu’ils ont, et maitriser mes ajustements.
Pour continuer, je fais légèrement évoluer le prompt et le format pour orienter le rendu vers un flyer destiné à une fête d’été ou “summer party”, dans la mesure où je trouve qu’il se prête bien à ce type d’utilisation:
cocktail flyer titled « SUMMER PARTY » --sref
2140267253::3 3721818712::4 1833276508 --sw
200 --p
wvidm64::3 8lzzdqb::2 3yjgphi::3 ysh3asp::2 --s
1000
cocktail flyer titled « SUMMER PARTY » subtitled « by GenIArt » --sref
2140267253::3 3721818712::4 1833276508 --sw
200 --p
wvidm64::3 8lzzdqb::2 3yjgphi::3 ysh3asp::2 --s
1000 --ar
2:3



Pour conclure, je génère 3 images dans 3 styles différents : une dans le style d’Enki Bilal, une dans le style de Picasso et une dans un style cinématographique que j’ajoute ensuite à mes styles aléatoires et aux personnalisations de modèle (sur certains rendus j’ai enlevé l’image dans le style d’Enki Bilal pour avoir des rendus plus clean).
Notez que les images de référence et les sref random ont, au delà du style lui même, une grosse influence sur la colorimétrie de vos images générées.
Je finis en vous montrant quelques rendus obtenus en combinant tout cela (modèle de personnalisation, sref random, et sref d’images).
Les combinaisons sont infinies, il s’agit ensuite de réussir à bien doser pour équilibrer la force de chacun des styles en fonction de leur influence, du prompt, et du résultat souhaité.
Voici la base du prompt avec quelques légères variations au niveau du prompt et des paramètres énumérés précédemment.
cocktail flyer titled « SUMMER PARTY » [éléments supplémentaires]
--p
wvidm64::5 8lzzdqb::4 3yjgphi::3 ysh3asp::2--s
450--sref
2140267253::5 3721818712::4 2257509434::3 https://s.mj.run/6rvQy560s1s ::2 https://s.mj.run/JEGbkpGrbRw ::2 https://s.mj.run/9JKd3Zl6jvo ::4--sw
110--ar
2:3
Bien sur ils ne sont pas parfaits et méritent quelques petites retouches sur photoshop, d’autant plus que j’ai un stylize élevé et que donc le texte est souvent approximatif, mais tout cela donne déjà une très bonne base de travail.
Aussi je ne recommande pas nécessairement cette méthode pour obtenir des flyers 😅, il y a beaucoup plus simple et il y a surtout une multitude de façons d’y arriver, j’ai pris cette direction pour montrer comment on pouvait exploiter l’intégralité de ces paramètres et présenter l’étendue des possibilités.
Il y aurait encore beaucoup à dire sur les sref random et sur les personnalisations de modèles, je décortique tout cela régulièrement en direct sur twitch.tv/geniart_fr, retrouvez d’ailleur ci-dessous la rediffusion du live durant lequel j’ai réalisé ces créations.
Rediffusion intégrale du live du 20 juin
Il s’agit de l’intégralité du live qui commence par le debrief des office hours (vous pouvez éventuellement passer les 30 premières minutes), j’ai du le re-uploader à cause d’un soucis de son. À cause d’un soucis technique, et à mon plus grand regret le chat de twitch n’est pas retranscrit sur le replay, mais vous pouvez consulter la rediffusion sur ma chaine twitch pour profiter de toutes les interactions.
Ce tuto a été publié dans le magazine LHC du mois de juillet, que je vous invite chaleureusement à aller découvrir si ce n’est pas déjà fait!
Merci de m’avoir lu et à bientôt!
Laisser un commentaire