En bref: Génération de texte en cours d’entrainement et de test pour la V7. La V7 sortira sur la base du dataset de laV6 avec une nouvelle architecture, et serra mis à jour avec le nouveau dataset quand il aura été nettoyé et qu’il serra pret. 3 types de modèle vidéo à l’étude, la 3d montre des bons résultats et il est prévu d’augmenter les équipes travaillant dessus.
🔶 Développement et améliorations du modèle V7
- L’entraînement du modèle V7 dure depuis environ un mois avec des améliorations notables de la qualité d’image par rapport à V6.
- Deux sessions d’entraînement sont en cours : une avec des données textuelles enrichies et une avec moins de données ; la sélection finale est attendue d’ici la fin de la semaine.
- L’accent est mis sur l’amélioration de l’architecture du modèle, car le jeu de données principal n’a pas beaucoup changé depuis V4.
🔶 Optimisation de la vitesse et processus d’optimisation
- La phase finale implique un processus de distillation visant à optimiser et accélérer le modèle.
- Les améliorations de vitesse sont essentielles pour l’expérience utilisateur, permettant des itérations plus rapides lors de l’affinement des images.
- L’équipe ajuste les paramètres de calcul et prépare les serveurs, l’optimisation devant durer quelques jours.
🔶 Défis liés aux jeux de données
- Un nouveau jeu de données plus large a été collecté, mais n’a pas été suffisamment nettoyé à temps pour la sortie de V7.
- Le modèle V7 actuel repose sur l’ancien jeu de données, avec des plans pour intégrer les données nettoyées et élargies lors d’une future mise à jour.
- Les améliorations du jeu de données devraient mieux capturer des détails exotiques (par exemple, des éléments mythologiques ou historiques) même si les éléments courants restent largement inchangés.
- Des efforts futurs incluent des tests A/B améliorés pour évaluer l’impact des mises à jour des jeux de données.
🔶 Considérations pour la future version (V8)
- La V7 a été intentionnellement simplifié par rapport à la V6 pour améliorer les performances; la V8 pourrait réintroduire de la complexité pour des améliorations supplémentaires.
- L’incertitude demeure quant à savoir si la V8 se concentrera davantage sur la capacité brute ou les améliorations de vitesse.
- Des innovations architecturales prévues pour la V8 visent à offrir une avancée radicale des performances du modèle.
🔶 Développement et stratégie du modèle vidéo
- Des résultats de « proof-of-concept » prometteurs ont changé les perspectives : la qualité vidéo devrait s’améliorer considérablement au cours de l’année.
- Trois approches potentielles sont en cours d’évaluation : développer des modèles vidéo en interne, s’associer à d’autres entreprises ou adopter une stratégie hybride.
- Les considérations clés incluent la cohérence des résultats, la gestion des coûts et les exigences spécifiques des serveurs.
- L’équipe évalue comment intégrer au mieux la vidéo dans le flux de travail global tout en équilibrant les contraintes de ressources.
🔶 Capacités 3D et fonctionnalités de recadrage
- Des expériences réussies indiquent que la génération 3D à partir d’images Midjourney est désormais réalisable.
- Les objectifs à court terme incluent des fonctionnalités pour déplacer la caméra, recadrer et re-calculer les images.
- La vision à long terme implique la création d’une expérience de génération en temps réel dans un monde ouvert.
- Des plans sont en place pour recruter des talents supplémentaires dans le domaine de la 3D afin d’accélérer le développement.
- Des discussions internes évaluent l’équilibre entre le perfectionnement de la génération d’images de base et l’expansion vers de nouvelles fonctionnalités.
🔶 Améliorations du site web et de l’interface utilisateur
- L’infrastructure a été mise à jour pour prendre en charge des traitements par lots plus importants et des flux de travail d’édition plus avancés.
- De nouveaux concepts d’interface sont en cours d’exploration, notamment des éditeurs web améliorés avec des calques, des outils de sélection optimisés, des dossiers et des espaces de travail.
- Les fonctionnalités existantes comme la personnalisation, les mood boards et les codes Sref continueront d’être prises en charge.
- Il y a de l’incertitude quant au calendrier exact des mises à jour de l’interface en raison des changements possibles dans la taille des lots et les performances de V7.
Merci à James Griffing pour son aide.
Venez partager vos impressions sur notre serveur Discord ou en commentaire, et à la semaine prochaine pour des nouvelles infos!
Laisser un commentaire