Passer au contenu

YouTube : un doublage plus naturel des vidéos avec l’intelligence artificielle

YouTube veut simplifier le doublage des vidéos en différentes langues grâce à l’intelligence artificielle. L’entreprise a révélé lors de la VidCon qu’elle intégrait l’équipe de Aloud, un service de doublage alimenté par l’IA provenant d’un incubateur de Google. Les créateurs vont en bénéficier pour diffuser leurs contenus auprès d’un public encore plus large.

YouTube a profité de la VidCon pour annoncer son intention d’intégrer l’équipe de Aloud, un service de doublage généré par l’intelligence artificielle provenant de l’incubateur Area 120 de Google. L’outil Aloud fonctionne en transcrivant d’abord la vidéo, fournissant dès lors un transcript texte qu’il est possible de revoir et d’éditer. Ensuite, Aloud traduit et produit le doublage. L’outil est actuellement testé par des centaines de créateurs, et supporte déjà quelques langues comme l’anglais, l’espagnol et le portugais. D’autres langues seront ajoutées prochainement.

L’IA pour un doublage plus naturel et expressif

Aloud pourra se révéler très utile dans un contexte où un nombre croissant de créateurs ajoutent des doublages en plusieurs langues à leurs vidéos. Pour ceux qui souhaitent entendre un exemple des résultats d’Aloud, ils peuvent consulter le doublage en espagnol de cette vidéo de la chaîne Amoeba Sisters. Pour l’avenir, YouTube travaille à l’amélioration du rendu des pistes audio traduites plus proches de la voix du créateur, avec davantage d’expressivité et une synchronisation labiale. Ces fonctionnalités sont prévues pour l’année prochaine.

Le nouvel outil Aloud a pour objectif de permettre aux créateurs de « doubler rapidement et facilement leurs vidéos en plusieurs langues, libérant ainsi des connaissances qui pourraient être enfermées dans une seule langue aujourd’hui ». Google espère que cette fonctionnalité rendra le doublage plus accessible aux créateurs qui le trouvent trop compliqué ou trop coûteux pour doubler leurs vidéos en plusieurs langues.

Aloud devrait donc aider les créateurs à atteindre un public plus large. Selon Amjad Hanif de YouTube, la plateforme travaille non seulement à faire en sorte que les pistes audio traduites sonnent comme la voix du créateur, mais aussi à incorporer plus d’expression dans le contenu doublé. La synchronisation labiale rendra les vidéos plus naturelles, mais pour le moment, les vidéos resteront décalées par rapport à l’audio et la voix doublée sonnera relativement mécanique.

L’intelligence artificielle, bien utilisée, peut donc se montrer très utile pour les créateurs de contenus, même si techniquement parlant il reste encore pas mal d’étapes à franchir pour qu’on ne fasse plus la différence entre la voix d’origine et le doublage, notamment pour les mouvements des lèvres. En attendant, ceux qui préfèrent lire peuvent toujours activer le sous-titrage qui depuis longtemps déjà, s’appuie sur l’IA pour retranscrire textuellement la piste audio.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode