Heygen l'IA capable de doubler une vidéo dans plusieurs langues simultanément

ChatGPT, Midjourney, les programmes d’intelligence artificielle se multiplient avec des résultats de plus en plus étonnant. Deux anciens de Tiktok créent un outil qui permet de traduire automatiquement une vidéo en plusieurs langues, en respectant l’intonation et le mouvement des lèvres du locuteur.
Article rédigé par franceinfo - Anicet Mbida
Radio France
Publié Mis à jour
Temps de lecture : 1 min
Heygen l'IA capable de doubler une vidéo dans plusieurs langues simultanément. Photo d'illustration (THIERRY GACHON / MAXPPP)

La barrière de la langue serait-elle en train de tomber ? Deux ingénieurs, qui travaillaient auparavant pour TikTok, ont mis au point HeyGen, un programme de création de vidéos capable de générer un avatar d’une personne. Ils viennent d’y ajouter un module de traduction automatique et son succès est fulgurant.

Dans la vidéo ci-dessus, Lionel Messi en conférence de presse parle dans un anglais parfait, ce qui a surpris puisqu’il est connu pour ne savoir parler qu’une seule langue : l’espagnol. Pourtant, la synchronisation des lèvres est parfaite. Même le ton et l’intonation sont respectés. La voix serait celle de Messi, c’est l’ambition de ce logiciel : être capable de cloner les voix et même de reproduire certains accents. Mais ce n’est pas encore tout à fait au point. 

Tout le monde connaît la voix du général de Gaulle. Maintenant, il est possible d’entendre son discours traduit en italien. S'il y a une ressemblance avec le général de Gaulle, la voix n'est pas exactement la même. Même problème quand le programme traduit une voix en français, il le fait avec un accent québécois.

Le résultat n'est pas parfait, mais c’est suffisant pour une vidéo d’entreprise ou celle d’un influenceur sur internet. Cela permet de diffuser très facilement ses vidéos en plusieurs langues avec une parfaite synchronisation des lèvres : le début de la fin des vidéos sous-titrées sur internet.

Une mauvaise nouvelle pour les doubleurs

Les acteurs-voix ont été les premiers (avec les figurants) à faire grève à Hollywood contre l’intelligence artificielle. Plusieurs films utilisent déjà une version plus avancée de cette technologie pour le doublage au cinéma sans passer par des acteurs.

Mais ce qui inquiète avec les outils de HeyGen ou de Synthesia (qui fait à peu près la même chose), c’est leur simplicité d’utilisation et le fait qu’ils sont capables de créer des personnages virtuels plus vrais que nature, à qui l’on peut faire dire n’importe quoi. Méfiez-vous de ce que vous voyez sur internet… Et de ce que vous entendez !

Commentaires

Connectez-vous à votre compte franceinfo pour participer à la conversation.