En bref: La v7 pourrait être prête d’ici deux/trois semaines, nouvel upscaler en développement. Le modèle de génération de vidéos devrait être extrêmement rapide, avec 3 modes: text-to-video et vary-to-video (img-to-video qui conserve moins l’image d’origine) prometteur et image-to-video pour l’instant pas encore à la hauteur des attentes.

🔶Calendrier de sortie de la Version 7 (V7)

  • Tests internes complets du pipeline prévus pour aujourd’hui.
  • Phase de test avec guides et modérateurs ciblée pour la fin de la semaine avec un modèle incomplet mais fonctionnel.
  • Intégration finale des fonctionnalités et optimisation de la vitesse attendues la semaine prochaine.
  • Sortie publique de V7 prévue dans environ deux semaines.
  • Des retards sont possibles en raison de l’intégration interne non testée et de la refonte récente du code.
  • V7 sera initialement lancé en mode alpha ; des mises à jour et modifications pourront survenir sans préavis.

🔶Performances et optimisation de la Version 7

  • Le mode par défaut de V7 devrait être deux fois plus rapide que les versions précédentes.
  • Une variante plus lente mais de meilleure qualité est envisagée.
  • Possibilité d’ajouter des curseurs ou contrôles pour ajuster l’équilibre entre vitesse et qualité après la sortie.
  • Un nouvel entraînement post-lancement est prévu pour améliorer immédiatement la qualité.
  • L’intégration de nouveaux jeux de données est en cours d’étude pour affiner encore davantage le modèle.

🔶Améliorations de l’upscaler

  • Développement en cours pour des upscalers plus rapides avec des capacités de résolution potentiellement supérieures.
  • Objectif possible de réintroduire un upscaler 4x.
  • Des différences comportementales significatives sont attendues ; les résultats exacts restent incertains à ce stade.

🔶Omni Reference et codes de personnalisation

  • La fonctionnalité Omni Reference sera intégrée lors de la distillation finale.
  • Amélioration substantielle attendue par rapport à la Version 6.
  • Débat en cours sur la compatibilité ou non avec les codes de personnalisation existants (SF).
  • La priorité actuelle est de maintenir une compatibilité ascendante, bien qu’aucune garantie absolue ne soit donnée.

🔶Développement des fonctionnalités vidéo

  • Préparations en cours pour des sessions d’entraînement vidéo intensives dans une à deux semaines.
  • Première version du modèle vidéo prévue, équilibrant coût et qualité.
  • Planification d’une Version 2 du modèle vidéo avec des améliorations majeures.
  • Trois workflows à l’étude :
    • Texte-vers-Vidéo : Qualité la plus élevée et moins d’échecs ; candidat principal si les performances sont satisfaisantes.
    • Image-vers-Vidéo : Rencontre des difficultés majeures, notamment sur les visages et l’animation d’éléments esthétiques ; une amélioration pourrait nécessiter un mois supplémentaire.
    • Vari-vers-Vidéo : Offre plus de flexibilité, mais risque d’altérer involontairement des éléments souhaités.
  • Le modèle vidéo vise une vitesse comparable aux modèles d’images actuels avec un objectif agressif de réduction des coûts.
  • Améliorations significatives attendues en qualité vidéo et réduction des coûts au cours des six prochains mois.

🔶Feuille de route pour les fonctionnalités vidéo et 3D

  • Des modes vidéo supplémentaires sont prévus après la sortie de V7 et du premier modèle vidéo.
  • Les fonctionnalités 3D sont retardées et seront prioritaires après l’achèvement des jalons V7 et vidéo.

🔶Restructuration de l’infrastructure cloud et des serveurs

  • Efforts importants en cours pour restructurer le cloud afin d’améliorer les performances du service.
  • Migration des serveurs prévue sur les six prochains mois pour accélérer la plateforme et potentiellement réduire les coûts.
  • Les changements d’infrastructure sont considérés comme logistiques complexes et gourmands en ressources.

🔶Améliorations de l’éditeur et du mode Batch

  • Poursuite du développement des améliorations de l’éditeur.
  • Progression en cours pour les modes batch à grande échelle et les nouveaux flux de travail.

🔶Participation de la communauté et retours d’expérience

  • Organisation de sessions de notation pour évaluer l’esthétique et les fonctionnalités après la sortie de V7.
  • Événement majeur de notation prévu spécifiquement pour les futurs modèles vidéo.
  • Engagement à maintenir une transparence avec la communauté sur les processus internes et l’évolution des fonctionnalités.

Merci à James Griffing pour son aide.

Debriefing des Office Hours Midjourney

Venez partager vos impressions sur notre serveur Discord ou en commentaire, et à la semaine prochaine pour des nouvelles infos!