En bref: La v7 pourrait être prête d’ici deux/trois semaines, nouvel upscaler en développement. Le modèle de génération de vidéos devrait être extrêmement rapide, avec 3 modes: text-to-video et vary-to-video (img-to-video qui conserve moins l’image d’origine) prometteur et image-to-video pour l’instant pas encore à la hauteur des attentes.
🔶Calendrier de sortie de la Version 7 (V7)
- Tests internes complets du pipeline prévus pour aujourd’hui.
- Phase de test avec guides et modérateurs ciblée pour la fin de la semaine avec un modèle incomplet mais fonctionnel.
- Intégration finale des fonctionnalités et optimisation de la vitesse attendues la semaine prochaine.
- Sortie publique de V7 prévue dans environ deux semaines.
- Des retards sont possibles en raison de l’intégration interne non testée et de la refonte récente du code.
- V7 sera initialement lancé en mode alpha ; des mises à jour et modifications pourront survenir sans préavis.
🔶Performances et optimisation de la Version 7
- Le mode par défaut de V7 devrait être deux fois plus rapide que les versions précédentes.
- Une variante plus lente mais de meilleure qualité est envisagée.
- Possibilité d’ajouter des curseurs ou contrôles pour ajuster l’équilibre entre vitesse et qualité après la sortie.
- Un nouvel entraînement post-lancement est prévu pour améliorer immédiatement la qualité.
- L’intégration de nouveaux jeux de données est en cours d’étude pour affiner encore davantage le modèle.
🔶Améliorations de l’upscaler
- Développement en cours pour des upscalers plus rapides avec des capacités de résolution potentiellement supérieures.
- Objectif possible de réintroduire un upscaler 4x.
- Des différences comportementales significatives sont attendues ; les résultats exacts restent incertains à ce stade.
🔶Omni Reference et codes de personnalisation
- La fonctionnalité Omni Reference sera intégrée lors de la distillation finale.
- Amélioration substantielle attendue par rapport à la Version 6.
- Débat en cours sur la compatibilité ou non avec les codes de personnalisation existants (SF).
- La priorité actuelle est de maintenir une compatibilité ascendante, bien qu’aucune garantie absolue ne soit donnée.
🔶Développement des fonctionnalités vidéo
- Préparations en cours pour des sessions d’entraînement vidéo intensives dans une à deux semaines.
- Première version du modèle vidéo prévue, équilibrant coût et qualité.
- Planification d’une Version 2 du modèle vidéo avec des améliorations majeures.
- Trois workflows à l’étude :
- Texte-vers-Vidéo : Qualité la plus élevée et moins d’échecs ; candidat principal si les performances sont satisfaisantes.
- Image-vers-Vidéo : Rencontre des difficultés majeures, notamment sur les visages et l’animation d’éléments esthétiques ; une amélioration pourrait nécessiter un mois supplémentaire.
- Vari-vers-Vidéo : Offre plus de flexibilité, mais risque d’altérer involontairement des éléments souhaités.
- Le modèle vidéo vise une vitesse comparable aux modèles d’images actuels avec un objectif agressif de réduction des coûts.
- Améliorations significatives attendues en qualité vidéo et réduction des coûts au cours des six prochains mois.
🔶Feuille de route pour les fonctionnalités vidéo et 3D
- Des modes vidéo supplémentaires sont prévus après la sortie de V7 et du premier modèle vidéo.
- Les fonctionnalités 3D sont retardées et seront prioritaires après l’achèvement des jalons V7 et vidéo.
🔶Restructuration de l’infrastructure cloud et des serveurs
- Efforts importants en cours pour restructurer le cloud afin d’améliorer les performances du service.
- Migration des serveurs prévue sur les six prochains mois pour accélérer la plateforme et potentiellement réduire les coûts.
- Les changements d’infrastructure sont considérés comme logistiques complexes et gourmands en ressources.
🔶Améliorations de l’éditeur et du mode Batch
- Poursuite du développement des améliorations de l’éditeur.
- Progression en cours pour les modes batch à grande échelle et les nouveaux flux de travail.
🔶Participation de la communauté et retours d’expérience
- Organisation de sessions de notation pour évaluer l’esthétique et les fonctionnalités après la sortie de V7.
- Événement majeur de notation prévu spécifiquement pour les futurs modèles vidéo.
- Engagement à maintenir une transparence avec la communauté sur les processus internes et l’évolution des fonctionnalités.
Merci à James Griffing pour son aide.
Venez partager vos impressions sur notre serveur Discord ou en commentaire, et à la semaine prochaine pour des nouvelles infos!
Laisser un commentaire