YouTube intègre un outil de doublage alimenté par l'IA

Dans une annonce récente, YouTube a révélé tester un nouvel outil qui aidera les créateurs à doubler automatiquement leurs vidéos dans d'autres langues grâce à l'intelligence artificielle. Cette initiative a vu YouTube s'associer à Aloud, un service de doublage alimenté par l'IA qui fait partie de l'incubateur interne de Google, Area 120.

Multilinguisme et Accessibilité

Plus tôt cette année, YouTube a introduit la prise en charge des pistes audio en plusieurs langues, permettant aux créateurs d'ajouter un doublage à leurs nouvelles vidéos et à celles existantes. Cela leur a permis d'atteindre un public international plus large. À partir de juin 2023, les créateurs ont doublé plus de 10 000 vidéos dans plus de 70 langues.

Avant cette mise à jour, les créateurs devaient s'associer directement avec des fournisseurs de doublage tiers pour créer leurs pistes audio, ce qui pouvait être un processus long et coûteux. Aloud leur permet de doubler des vidéos sans frais supplémentaires.

Présentation de Aloud

Google a introduit Aloud pour la première fois en 2022. Le produit de doublage alimenté par l'IA transcrit une vidéo pour le créateur, puis la traduit et produit une version doublée. Les créateurs peuvent revoir et éditer la transcription avant qu'Aloud ne génère le doublage.

Amjad Hanif, vice-président des produits pour créateurs de YouTube, a déclaré que l'entreprise testait l'outil avec des centaines de créateurs. Il a ajouté que l'entreprise ouvrirait bientôt l'outil à tous les créateurs.

Pour le moment, Aloud est disponible en anglais, espagnol et portugais. Cependant, d'autres langues seront proposées à l'avenir, telles que le hindi et le bahasa indonésien, entre autres.

Vers une meilleure personnalisation du doublage

Hanif a ajouté que YouTube travaille pour que les pistes audio traduites ressemblent davantage à la voix du créateur, avec plus d'expression et de synchronisation labiale. YouTube a confirmé qu'à l'avenir, l'IA générative permettrait à Aloud de lancer des fonctionnalités comme la préservation de la voix, un meilleur transfert d'émotion et la réanimation labiale.