Connu pour ses visuels générés par IA aux rendus souvent spectaculaires, Midjourney se lance dans la vidéo. La première version de son Video Model (V1) est accessible dès maintenant pour les abonnés payants (à partir de 10 $ par mois) et uniquement via le web. Ce nouvel outil permet d’animer une image fixe — qu’elle ait été produite dans Midjourney ou importée — en un clip de cinq secondes. L’utilisateur peut ensuite allonger la séquence jusqu’à 20 secondes, par tranches de quatre secondes.
Des mondes simulés en temps réel
Le principe est simple : on clique sur un bouton « Animate », et le modèle se charge du reste. Deux modes sont disponibles : un mode automatique, qui « fait bouger les choses » sans intervention manuelle, et un mode manuel dans lequel on peut préciser la façon dont la scène doit évoluer. L’utilisateur peut aussi choisir entre une animation « high motion » ou « low motion », en fonction de l’effet recherché. À noter : trop de mouvement peut entraîner des résultats inattendus, tandis que le mode calme risque parfois… de ne rien faire bouger du tout.
Introducing our V1 Video Model. It's fun, easy, and beautiful. Available at 10$/month, it's the first video model for *everyone* and it's available now. pic.twitter.com/iBm0KAN8uy
— Midjourney (@midjourney) June 18, 2025
Autre possibilité bienvenue : l’importation d’une image externe. Il suffit alors de la glisser dans la barre de génération, de l’utiliser comme point de départ et de rédiger une consigne de mouvement.
Si cette première incursion dans la vidéo semble modeste, Midjourney voit beaucoup plus loin. Dans un communiqué, l’équipe explique que l’objectif final est de créer des simulations en temps réel dans des mondes ouverts générés par IA : des environnements interactifs où tout peut bouger à la demande. Pour en arriver là, il faut d’abord assembler les « briques » nécessaires : des modèles d’images, de vidéo, de 3D, et de rendu en temps réel.
La vidéo est donc un passage obligé… et aussi un terrain d’expérimentation. « On voulait vous donner quelque chose de simple, amusant, beau et accessible », résume l’équipe. Le coût d’un job vidéo est environ huit fois supérieur à celui d’une image, mais chaque tâche produit quatre vidéos de cinq secondes. À ce prix, selon Midjourney, la vidéo revient à environ « une image par seconde », soit une baisse drastique du coût de production par rapport aux standards du marché.
Ce lancement n’arrive pas dans un climat apaisé. Midjourney est en effet poursuivi en justice par Disney et NBCUniversal, qui accusent l’entreprise d’avoir utilisé leurs œuvres pour entraîner ses modèles. Une plainte qui rappelle les nombreuses critiques adressées à l’ensemble du secteur de l’IA générative, accusé de piller les œuvres existantes.
L’entreprise tente de désamorcer les craintes en appelant à une utilisation « responsable » de ses outils. « Bien employés, ces modèles peuvent être utiles, amusants, voire bouleversants », plaide Midjourney. L’industrie créative risque bien de ne pas y voir autre chose qu’une nouvelle menace.