En bref: Possible V6.2 avant la V7 retardée, reprise des test 3D, 2 modèles vidéos à l’étude. Omni-référence sur la v7 qui permettra la consistance de logo et d’objet.
🔶Modèle V7 et calendrier de lancement
- Concentration sur le perfectionnement du futur modèle V7.
- Retards dus à des problèmes de qualité des données détectés dans le nouvel ensemble de données.
- Nécessite un nouveau cycle d’entraînement avec le dataset V6. Les données du modèle v7 ne viendront que sur une version ultérieure après nettoyage.
- Le lancement est désormais prévu pour février au lieu de janvier.
- V7 vise un support multilingue amélioré, une meilleure cohérence et des références de personnages plus fiables.
- Certains aspects de la qualité et de l’esthétique des images pourraient encore nécessiter des améliorations après V7.
🔶Fonctionnalité vidéo
- Deux orientations principales à l’étude :
- Qualité maximale : Sortie de haute qualité, mais lente et coûteuse à produire.
- Vitesse maximale : Génération plus rapide, moins coûteuse, mais de qualité inférieure.
- Préoccupation concernant les coûts pour les utilisateurs, notamment ceux du palier à 10 $/mois.
- Équilibre entre l’aspect “ludique” et les cas d’utilisation professionnels/payants.
- Étude pour savoir s’il faut entraîner un modèle vidéo interne ou utiliser des API externes sous licence.
- Il est probable que les deux modèles, rapide (interne) et lent (sous licence ou externe), soient proposés pour évaluer l’usage et l’intérêt.
🔶Exploration 3D
- Intérêt renouvelé pour la 3D après des tests internes prometteurs avec des ensembles de données mis à jour.
- Évaluation de la faisabilité d’un lancement d’une fonctionnalité 3D initiale ce mois-ci ou peu après.
- Décision en attente concernant le niveau de finition des sorties 3D et l’effort nécessaire.
- Potentiel à long terme d’intégration d’expériences 3D et de simulation de monde ouvert.
🔶Lot important V6 (V6.2)
- Lancement intermédiaire possible avant V7.
- Permet des tailles de lots plus importantes pour améliorer la personnalisation et le contrôle.
- Tests révélant un contrôle utilisateur nettement amélioré dans chaque lot généré.
- Les détails finaux de l’interface et de l’expérience utilisateur sont encore en cours de perfectionnement.
🔶Références de personnages et Omni-Reference
- V7 offrira une meilleure gestion des références de personnages, corrigeant les incohérences antérieures (ex. : mains, armes).
- Potentiel pour une capacité “omni-référence” permettant d’intégrer des éléments spécifiques (ex. : logos, objets).
- Reflète les retours de la communauté, mettant l’accent sur la cohérence des personnages et le contrôle du style.
🔶Coût, utilisation des serveurs et impact communautaire
- Les contraintes budgétaires limitent les modèles d’entraînement extrêmement coûteux (ex. : 100 M$+ pour certains modèles vidéo).
- Acquisition de serveurs importants en prévision des nouveaux lancements (V7, vidéo, 3D).
- Actuellement, la capacité supplémentaire des serveurs permet l’accès au mode relax pour le palier à 10 $, bien que cela puisse cesser une fois les nouvelles fonctionnalités lancées.
- Objectif continu : maintenir des sorties financièrement viables pour que Midjourney reste soutenu par la communauté.
🔶Différents niveaux de modèles (rapide vs lent)
- Observation constante : la plupart des utilisateurs choisissent les modes par défaut ou de meilleure qualité (plus lents), optant rarement pour des modes moins chers/de moindre qualité.
- Plans pour explorer si un modèle “rapide” pour des sorties rapides ou un usage moins coûteux pourrait séduire.
- Les professionnels pourraient payer davantage pour une qualité supérieure, mais la communauté plus large souhaite toujours des options abordables.
- Les données d’usage et les mises à jour d’abonnements après lancement orienteront les priorités de développement futures.
🔶Orientation future et vision de la plateforme
- Améliorations rapides attendues en matière de qualité d’image, de vitesse et de flux de travail dans les deux prochaines années.
- Considération d’ajouts de fonctionnalités avancées :
- Exploration basée sur la 3D.
- Référencement de styles plus flexible et bibliothèques de styles pilotées par la communauté.
- Solutions complètes incluant des API de modèles externes sous licence pour la vidéo ou d’autres modalités.
- Équilibrage de plusieurs projets simultanés (V7, 3D, vidéo, outils de style) compte tenu de la taille actuelle de l’équipe.
🔶Priorités des retours communautaires
- Création de personnages, cohérence et contrôles avancés de style restent des demandes majeures.
- Intérêt exprimé pour des outils de collaboration supplémentaires (ex. : exploration de styles générés par les utilisateurs).
- Mises à jour en cours de la page Explorer et possible ajout de nouvelles fonctionnalités de découverte de styles.
- L’équipe se concentrera probablement sur la V7 en priorité, puis finalisera ces initiatives supplémentaires à mesure que les ressources le permettront.
Merci à James Griffing pour son aide
Venez partager vos impressions sur notre serveur Discord ou en commentaire, et à la semaine prochaine pour des nouvelles infos!
Laisser un commentaire