France Info numérique, France info

Comment les erreurs de Google Traduction créent des "innovations linguistiques"

En utilisant l'anglais comme langue intermédiaire pour traduire mot à mot, l'algorithme du moteur de recherche se trompe régulièrement. Derrière ces erreurs, la puissance à moyen-terme de Google sur la linguistique.

--'--
--'--
Copié dans le presse-papier !
(Au siège de Google dans la Silicon Valley américaine © Maxppp)

Devant un texte en espagnol ou une traduction à faire en italien, qui n'a jamais utilisé Google Traduction? L'outil de traduction du moteur de recherche américain, bien que symbole de l'intelligence artificielle, est connu pour réserver quelquefois des surprises. Car il ne vas pas traduire directement de l'espagnol au français ou du français à l'italien mais va avoir recours à l'anglais en tant qu'intermédiaire, "langue pivot" pour reprendre l'expression de Frédéric Kaplan, professeur en humanités digitales à l'Ecole Polytechnique Fédérale de Lausanne qui s'intéresse aux conséquences linguistiques de l'utilisation des algorithmes de Google.

Exemple, pour traduire "cette fille est jolie" en italien, Google Traduction donne comme résultat "Questa ragazza è abbastanza" soit "cette fille est moyen, suffisamment". Autant dire une expression qui ne fera point sens aux oreilles d'Italiens. Pour l'algorithme, "pretty" peut dire "mignon" mais est aussi un adverbe de modération dans la langue anglaise. Interrogé par France Info, Frédéric Kaplan regrette que l"on parle beaucoup d'impérialisme de langues, de guerre des langues " du fait de l'utilisation principale de l'anglais sur Internet. "Sur le fond, il y a des effets plus cachés comme l'utilisation de l'anglais en langue pivot dans les traductions. Les tournures de l'anglais s'invitent dans d'autres langues" , explique-t-il.

Autre exemple donné dans un post sur son blog, l'expression idiomatique française "il pleut des cordes" va d'abord être correctement traduite en anglais "It rains cats and dogs" mais en italien, cela donnera à nouveau une expression inexistante. "Piove canni e gatti". Si la firme américaine a récemment ouvert sa communauté de traducteurs aux internautes pour améliorer son module de traduction, il y a tout de même des risques que l'expression soit relayée en ligne. "C'est une forme d'innovation linguistique qui commence à peupler des textes sur Internet, et plus intéressant, des algorithmes de Google vont analyser ces nouvelles tournure et pourquoi pas la suggérer dans quelques années dans ses prédictions semi-automatiques" , analyse le chercheur dont l'équipe a obtenu un financement du Fonds National suisse pour explorer les ressorts linguistiques de Google Traduction. 

Et derrière ce mécanisme de suggestion, ce que Frédéric Kaplan appelle dans une autre étude complémentaire "le capitalisme linguistique de Google". Le moteur de recherche a construit son succès en attribuant une valeur économique à des mots via des enchères où "certains mots ont plus de valeur que d'autres". Et plus il y a de mots suggérés, plus Google vous rend service ... tout en se rendant service.

(Au siège de Google dans la Silicon Valley américaine © Maxppp)