OpenAI est arrivé en février dernier avec la présentation de Sora, une IA permettant de créer des vidéos à partir des phrases (« invites ») saisies par l’utilisateur. De cette manière, OpenAI a fait un grand pas en avant, passant de la création d’images à la création de vidéos sans avoir besoin de connaissances artistiques ou techniques.
Le futur proposé par Sora était que n’importe qui puisse créer des vidéos de tout type, sans avoir aucune idée de la cinématographie. Les exemples présentés comprenaient des vidéos éducatives, humoristiques, de style documentaire ou cinématographique.
La réponse de Google ne s’est pas fait attendre. Conscient que vous ne pouvez pas être laissé pour compte, Google a présenté aujourd’hui I Spysa nouvelle IA pour la création vidéo qui surpasse déjà Sora sur certains aspects, et qui promet de s’améliorer avec l’aide des utilisateurs.
Veo est très similaire à Sora, dans le sens où Il suffit d’un texte descriptif de la scène que nous voulons générer. Ce qui est frappant, c’est qu’il est capable d’appréhender différents styles et techniques cinématographiques, comme les scènes au ralenti ou les scènes qui montrent le passage du temps. Une fois que vous avez créé la vidéo, elle peut également être éditée à l’aide de l’IA, en modifiant des aspects ou en ajoutant des détails.
En parlant d’ajouter, l’un des points forts de Veo par rapport à Sora est qu’il est capable de faire des vidéos de plus de 60 secondes; Bien qu’elle crée initialement une courte vidéo, l’utilisateur peut la prolonger en appuyant simplement sur un bouton, et l’IA examinera les caractéristiques de la vidéo originale pour l’allonger d’une manière logique.
✍️ Invite : « De nombreuses méduses tachetées palpitent sous l’eau. Leurs corps sont transparents et brillants dans les profondeurs de l’océan. pic.twitter.com/y9SmNd8NK0
– Google DeepMind (@GoogleDeepMind) 14 mai 2024
Cela peut être vu dans la vidéo d’une voiture qui traverse plusieurs scénarios sans changer de forme ; Cette cohérence a été une priorité pour Google. Veo s’appuie sur divers algorithmes et techniques, et est capable de générer des vidéos à une résolution de 1080p.
✍️ Invite : « Un cowboy solitaire chevauche son cheval à travers une plaine ouverte sous un magnifique coucher de soleil, une lumière douce et des couleurs chaudes. » pic.twitter.com/D8uKDZVWto
– Google DeepMind (@GoogleDeepMind) 14 mai 2024
Google affirme que Veo est capable de créer des vidéos dans différents styles, à la fois photoréalistes, surréalistes et animés, avec une large gamme de styles cinématographiques. Il l’a démontré en publiant plusieurs vidéos réalisées avec Veo.
✍️ Invite : “Un vaisseau spatial traverse l’immensité de l’espace, les étoiles défilant devant lui, à grande vitesse, de science-fiction.” pic.twitter.com/1vMib09PFs
– Google DeepMind (@GoogleDeepMind) 14 mai 2024
Google a collaboré avec des cinéastes indépendants, comme Danny Glover, pour le développement de Veo, dans le but que « n’importe qui puisse devenir réalisateur » ; Ils affirment que les modèles leur permettent une plus grande créativité et que les vidéos seront publiées à l’avenir.
✍️ Invite : « Une femme assise seule dans un café faiblement éclairé, un roman à moitié terminé ouvert devant elle. Esthétique du film noir, ambiance mystérieuse. “Noir et blanc.” pic.twitter.com/vFVXr4Cvxi
– Google DeepMind (@GoogleDeepMind) 14 mai 2024
Je vois est disponible en un nouvel outil, appelé VideoFX; Pour le moment, il n’est disponible que pour les utilisateurs aux États-Unis, même si Google a promis qu’il sera disponible dans davantage de pays à l’avenir.
