Nouveau monde, France info

Nouveau monde. Comment le big data s'est planté dans les prévisions pour le premier tour de la présidentielle

L'utilisation du big data par des start-up n'est pas encore au point pour les prévisions des votes. Pour le premier tour de la présidentielle, les prévisions alternatives aux sondages étaient fausses dans la plupart des cas.

avatar
franceinfoJérôme ColombainRadio France

Mis à jour le
publié le

Des bulletins dans un bureau de vote à Rennes(Ille-et-Vilaine), le 23 avril 2017.
Des bulletins dans un bureau de vote à Rennes(Ille-et-Vilaine), le 23 avril 2017. (DAMIEN MEYER / AFP)

L’intelligence artificielle n’est pas encore près de remplacer les sondages. Plusieurs start-up qui voulaient prédire le résultat du premier tour de la présidentielle à l’aide du big data se sont largement plantées.

Sondeurs 1 - big data 0

Elles se nomment Vigiglobe, Enigma, Predict my President (programme d'étudiants de Telecom Paris Tech) ou encore Filteris. Elles avaient prédit la victoire de François Fillon au premier tour ou des duels Fillon-Le Pen, Fillon-Mélenchon, etc. Bref, elles ont eu tout faux. Les instituts de sondages traditionnels, quant à eux, raillés pour s’être trompés lors des primaires, ont eu leur revanche avec le premier tour de la présidentielle.

Comment c'était censé fonctionner ?

Ces start-up, spécialisées dans le big data, basaient leurs analyses principalement sur les messages postés sur les réseaux sociaux, notamment Facebook et surtout Twitter. Filteris, jeune pousse d’origine française basée au Canada, expliquait ne pas calculer des intentions de vote mais examiner un "poids numérique" pour chaque candidat. Elle avait à son actif le fait d’avoir prédit la victoire de Donald Trump aux Etats-Unis.

Pourquoi ça n’a pas marché en France ?

Les algorithmes de ces entreprises sont très secrets mais il semble qu’il y ait plusieurs explications. D’abord, la sociologie des utilisateurs des réseaux sociaux ne reflète pas celle du corps électoral. Ensuite, les candidats dont les militants sont les plus actifs sont naturellement surreprésentés. Autre élément : les courbes de Google Trends, qui montrent les recherches sur le moteur de recherche, sont difficiles à interpréter car elles ne reflètent pas des sympathies particulières. Enfin, l’intelligence artificielle a du mal à saisir l’humour, l’ironie et à détecter les fausses nouvelles (fake news). Cela ne veut pas dire que cela n’arrivera jamais pour autant. Un jour, peut-être, l’ordinateur sera capable de lire dans la tête des gens ou au moins de prédire des mouvements massifs. Mais, visiblement, ce n’est pas pour tout de suite.

Et pour le deuxième tour ?

Les analystes 2.0 spécialisés dans le big data prédisent la même chose que les instituts de sondage. Par exemple, Filteris annonce Emmanuel Macron 59,8 % et  Marine Le Pen 40,1 %.

Des bulletins dans un bureau de vote à Rennes(Ille-et-Vilaine), le 23 avril 2017.
Des bulletins dans un bureau de vote à Rennes(Ille-et-Vilaine), le 23 avril 2017. (DAMIEN MEYER / AFP)