Vidéo

Google étoffe Flow avec la synthèse vocale sur images dans Veo 3

Vous pouviez déjà transformer n’importe quelle image en clip avec bruitages et ambiances sonores dans Flow, à l'aide de Veo 3. Désormais, il est possible d'ajouter une piste audio entièrement générée par IA afin de faire "parler" les photos. Si Google semble pour le moins enthousiaste de cette nouveauté, rappelons que la génération audio reste expérimentale, la qualité peut fluctuer.

Flow - Google
Flow - Google

Existe-t-il une limite à l'imagination avec l'intelligence artificielle générative ? Avec Google, pas sûr. Son outil Flow qui n'est autre qu'un studio de réalisation 100% IA s'améliore encore. Capable de générer des plans cinématographiques à partir de texte ou d’une première image grâce aux modèles Veo 3 (vidéo + audio), Imagen 4 (images) et Gemini (raisonnement) intégrés, il bénéficie aujourd'hui d'une mise à jour permettant de "faire parler" les images.

Disponible depuis cette semaine aux Etats-Unis et prochainement étendue à d'autres pays, la fonctionnalité ajoutée permet d'ajouter de la parole à des clips dans l'outil Flow lorsque l'utilisateur s'appuie sur Frames to Video. Concrètement, l'utilisateur importe ses propres images comme point de départ d’un clip vidéo. Veo 3 autorisait déjà l’ajout d’effets sonores et de bruitages ; aujourd'hui, il peut générer également de la voix.

La cible : les créateurs vidéo du monde entier

Google lance par ailleurs Frames to Video sur Veo 3 Fast pour augmenter les capacités sans avoir à faire appel à trop de crédits. Avec ces services, la firme vise d’abord les créateurs vidéo : réalisateurs, monteurs, équipes social media, agences et studios qui ont besoin de prototyper ou produire des clips rapidement. Depuis le lancement de Flow en mai, des dizaines de millions de vidéos ont déjà été créées.

Par ailleurs, dans le cadre de sa stratégie, Google annonce la disponibilité de Flow et de Google AI Ultra à 76 pays supplémentaires. A terme, la stratégie de la firme de Mountain View pourrait s'avérer payante : avec ces outils, les créateurs obtiennent des séquences prêtes au montage en quelques secondes, sans devoir chercher un comédien voix-off. De plus l’arrivée du mode Fast pour l’image-to-vidéo rend l’expérimentation moins chère – crucial pour les storyboards ou les tests publicitaires.

Enfin, en doublant presque la couverture géographique, Google met la pression sur des concurrents comme Runway ou Pika qui restent limités à certaines régions ou à la vidéo muette. Flow se rapproche doucement d'un logiciel de type Final Cut avec un petit plus : l'intelligence artificielle accessible depuis un navigateur.

Newsletter L'Usine Digitale
Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.