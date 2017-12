Si vous l'aviez au bout du fil, rien ne vous indiquerait qu'il s'agit d'un robot. Le nouveau moteur de synthèse vocal de Google, baptisé Tacotron 2, est désormais capable de produire des voix quasiment impossibles à distinguer de celles d'humains, a rapporté le site spécialisé Quartz (lien en anglais), jeudi 28 décembre. Il fait par ailleurs l'objet d'une étude scientifique publiée le 16 décembre par l'université de Cornell, détaillant son fonctionnement.

Pour faire la démonstration de sa prouesse technologique, la firme a mis en ligne de nombreux extraits sonores permettant de comparer la voix obtenue grâce à l'intelligence artificielle et celle d'une femme engagée pour lire certaines phrases. Ils confirment que Tacotron 2 est capable de respecter la ponctuation, de varier l'intonation – comme lorsqu'il s'agit de poser une question – et de prononcer correctement les homonymes ou encore les mots compliqués.

Bientôt la voix des applications de Google

Comment est-ce possible ? "Google s’appuie sur deux réseaux de neurones artificiels", explique le site spécialisé Cnet. "Le premier transforme le texte en spectrogramme audio – afin d’avoir une représentation précise du son et de l’intensité du signal – le second décrypte le spectrogramme et le transforme en fichier audio."

Cette nouvelle technologie viendra bientôt remplacer la voix que l’on retrouve actuellement dans les différentes applications développées par Google, ajoute Cnet. "Les anglophones seront les premiers servis, les autres langues devront patienter un peu", poursuit le site.