Cet article date de plus de six ans.

Amazon Echo, Google Home, HomePod d'Apple : vous faites quoi de mes données personnelles ?

Vincent Matalon, Robin Prudent

France Télévisions

Publié le 23/06/2018 06:56 Mis à jour le 23/06/2018 13:57

Temps de lecture : 13min

Une enceinte connectée HomePod présentée dans une boutique Apple de San Francisco (Californie), le 9 février 2018. (JUSTIN SULLIVAN / GETTY IMAGES NORTH AMERICA / AFP)

Alors que la marque à la pomme vient de sortir en France son enceinte HomePod, franceinfo revient sur les enjeux soulevés par les assistants vocaux en matière de confidentialité.

Il espère bien se faire une place dans votre salon. Disponible en France depuis lundi 18 juin, le HomePod d'Apple marque l'entrée de la célèbre marque à la pomme sur le marché des enceintes connectées, jusqu'à présent dominé par le Home de Google et l'Echo d'Amazon.

Ces appareils n'obéissent pas au doigt et à l'œil, mais à la voix : vous prononcez une suite de mots précise et ils sont censés répondre à vos moindres requêtes. Prévisions météo, questions de culture générale, recherche de recettes de cuisine… Sur le papier, les possibilités sont immenses. Mais est-on sûrs que ces appareils destinés à envahir les foyers ne nous écoutent pas à votre insu ? Et sait-on vraiment ce qu'ils font des données qui leur sont envoyées ? Franceinfo répond à ces questions.

1"OK Google" / "Dis, Siri" / "Alexa" : écoutes-tu les conversations que j'ai avec mes proches ?

Normalement, non. Sur le papier, le principe de ces enceintes connectées est simple. Il faut prononcer une phrase bien précise pour les activer : "OK Google" pour Google Home, "Alexa" pour Amazon Echo et "Dis, Siri" pour le HomePod d’Apple. Une fois la formule déclamée, un petit voyant s'éclaire pour indiquer que l'enceinte est bien à l'écoute de votre requête. Seul hic : "Pour pouvoir détecter les mots-clés, il faut que les micros soient en veille en permanence", rappelle Geoffrey Delcroix, membre du Laboratoire d'innovation numérique de la Cnil, à franceinfo. Normalement, quand il n'y a pas de faille, pas de bug, pas d'attaque, il ne transmet rien en dehors de l'appareil."

Mais des bugs, il y en a déjà eu. Aux États-Unis, l'assistant vocal Alexa d'Amazon a enregistré à son insu la conversation d'un couple et l'a envoyée à l'un de ses contacts… La raison ? Une série improbable de commandes vocales mal comprises par l'enceinte qui aurait abouti à l'envoi par e-mail de la conversation à une tierce personne, selon Amazon. Une autre faille a aussi été détectée dans la version "mini" du Google Home, indiquent Les Numériques. Le micro enregistrait intempestivement l'utilisateur, sans qu'il lui demande. Les leds de l'appareil, indiquant un enregistrement en cours, s'allumaient sans le moindre ordre physique ou oral. Google a reconnu que ce bug affectait certains appareils et a rapidement déployé une mise à jour pour éliminer cette faille.

En France, la Cnil a effectué quelques tests pour vérifier que les enceintes fonctionnaient bien comme l'annonçaient leurs constructeurs. Verdict : les connexions réseaux semblent indiquer que les données sont bien transmises uniquement quand les mots-clés sont détectés.

2Tu ne te servirais pas de ce que je te dis pour faire de l'argent ?

Soyons clairs : certaines données peuvent être utilisées pour alimenter le modèle économique des géants du web. Concrètement, comment ça se passe ? Une fois les mots magiques prononcés, l'enceinte connectée enregistre la requête de l'utilisateur. La phrase est alors transmise aux serveurs de l'entreprise pour analyse. "Le traitement ne se fait pas localement dans la machine", explique Geoffrey Delcroix. Au passage, les informations récupérées peuvent donc être utilisées à des fins commerciales.

Chez Google, cela fonctionne comme lorsque vous utilisez le fameux moteur de recherche ou que vous regardez une vidéo sur YouTube. "On ne vend pas de données aux entreprises", rappelle le géant du web. Les informations récoltées avec Google Home permettent d'alimenter et de préciser votre profil avec vos habitudes. Google peut ensuite l'utiliser pour proposer des publicités ciblées aux annonceurs. D'ailleurs, si Google Home ne déclame pas encore de pub, cette possibilité n'est pas complètement écartée par l'entreprise. Du côté d'Amazon, les enceintes permettent aussi d'accroître le nombre de ventes sur la plateforme. Un bon moyen de conquérir de nouveaux marchés et de fidéliser des clients.

Bref, il ne faut pas se leurrer : "Quand on voit les prix pratiqués chez Amazon et Google, les promotions agressives, on imagine bien que le modèle économique n'est pas seulement de gagner de l'argent en vendant un produit connecté", explique Geoffrey Delcroix. Certains assistants vocaux sont désormais vendus autour de 50 euros, quand ils ne sont pas carrément offerts pour l'achat d'autres produits. On n'est pas loin du fameux dicton : "Si c'est gratuit (ou pas cher), c'est que vous êtes le produit".

Pour Apple, le modèle semble un peu différent. Avec son HomePod à 350 euros, le constructeur propose un produit supplémentaire pour compléter son offre et éviter que ses clients ne sortent de son écosystème. Ainsi, HomePod est conçu pour être piloté par un autre produit Apple (et pas un smartphone Android, par exemple).

Les enceintes connectées Google Home (à gauche) et Amazon Echo (au centre), présentées lors d'un salon, le 1er septembre 2017 à Berlin (Allemagne). (MAXPPP)

3Combien de temps conserves-tu mes données personnelles ?

Difficile à savoir : les conditions d'utilisation des différents appareils consultés par franceinfo sont assez obscures sur cette question. En réalisant cet article, l'un de nos journalistes a ainsi eu la surprise de découvrir que l'ensemble des requêtes effectuées auprès de l'assistant vocal de Google depuis son téléphone avaient été méticuleusement conservées depuis février 2015. "Le Règlement général sur la protection des données (RGPD) a accentué les obligations de transparence dans ce domaine depuis le 25 mai, mais il est vrai que nous constatons que l'information sur la conservation des données personnelles utilisées par ce type d'appareils n'est pas très facile à trouver", explique à franceinfo Geoffrey Delcroix. L'expert juge que les différents acteurs du marché ont encore "une marge de progression" dans ce domaine.

"Il est à craindre que rien ne soit jamais supprimé, ajoute Simon Descarpentries, membre de la Quadrature du net. Matériellement, le stockage des données numériques ne coûte pas cher et il est possible de conserver des copies exactes des données collectées pour l'éternité numérique". Les enceintes produites par Google et Amazon disposent toutefois d'un historique des données vocales envoyées sur leurs serveurs et vous permettent de les supprimer une à une, ou sur une période donnée.

Pour Amazon Echo (ou tout autre assistant vocal distribué par Amazon) : direction l'application Alexa, installée sur votre téléphone. Cliquez sur "paramètres", puis "historique". Vous pourrez visualiser l'intégralité des requêtes vocales qui ont été transmises aux serveurs d'Amazon depuis votre appareil, et les supprimer une à une. Pour un nettoyage plus massif, direction cette page. Cliquez sur "vos appareils", sélectionnez le nom de votre enceinte connectée, puis cliquez sur "gérer les enregistrements vocaux". Une fenêtre vous permettant de supprimer l'intégralité de vos requêtes vocales devrait apparaître.

Pour Google Home (ou tout autre appareil utilisant l'assistant vocal de Google) : rendez-vous sur la rubrique "mon activité" de Google, qui permet d'obtenir un aperçu général des données confiées au géant de la recherche en ligne, puis cliquez sur l'icône représentant trois points alignés verticalement, puis sur "supprimer des activités". Vous pourrez ensuite supprimer à la volée toutes les données vocales enregistrées durant une période donnée (le jour même, la veille, les sept derniers jours, depuis le début de l'utilisation…). Dans la liste des produits proposés, sélectionnez "assistant", validez, et le tour est joué !

Apple ne propose pas de fonction similaire dans les paramètres de son enceinte connectée. Cela s'explique par la politique choisie par l'entreprise en matière de protection des données, indique le site Cnet (article en anglais). Les requêtes envoyées par HomePod aux serveurs d'Apple seraient ainsi "cryptées et anonymisées" lors de leur traitement. De telle sorte que "même l'entreprise n'est pas en mesure de les consulter" de son côté, précise Cnet.

4Envoies-tu ce que je te dis à des humains pour devenir plus intelligente ?

Toutes les enceintes connectées du marché utilisent des technologies d'apprentissage automatique, pour faire en sorte que les serveurs auxquels elles sont reliées comprennent les instructions communiquées grâce au son de votre voix, et puissent y répondre. Mais ces systèmes d'intelligence artificielle ne sont pas infaillibles et ont besoin que leurs erreurs (déclenchement intempestif du micro, mauvaise compréhension d'un mot...) soient signalées pour qu'elles ne se répètent pas par la suite.

Mi-mai, l'association de défense des droits des citoyens sur internet La Quadrature du net a publié sur son site le témoignage de Julie. Cette jeune femme était chargée de corriger les erreurs de transcription de Cortana, l'assistant vocal de Microsoft, à partir d'enregistrements d'utilisateurs qui n'étaient visiblement pas au courant que leurs conversations pouvaient être écoutées par des tiers.

On écoutait l'enregistrement audio, ensuite un texte s'affichait, nous montrant ce que Cortana avait compris et retranscrit. Notre travail était de vérifier si elle avait bien compris – si ce n'était pas le cas, on devait corriger le texte.

Julie, "transcripteuse" pour l'assistant vocal Cortana
à La Quadrature du net

Julie dit avoir entendu des conversations privées et des éléments sensibles, comme des numéros de Sécurité sociale. Microsoft ne distribue pas d'enceinte équipée du système Cortana. Mais celles d'autres marques disponibles sur le marché ont-elles recours au même type d'intervention humaine sans que l'utilisateur en soit averti ? Contacté, Google assure que non. L'entreprise explique qu'il est possible d'utiliser son Google Home pour faire remonter une erreur à ses équipes via un message vocal (de type "OK Google : envoyer un commentaire à Google"), et que seuls ces enregistrements envoyés en toute connaissance de cause peuvent être écoutés par ses ingénieurs. De leur côté, Amazon et Apple n'ont pas répondu aux questions de franceinfo à ce sujet.

Selon Simon Descarpentries, membre de la Quadrature du net, "rien n'empêche" que des humains puissent écouter des requêtes envoyées innocemment à votre enceinte connectée de salon. "Dans la mesure où ces appareils fonctionnent avec des logiciels tenus secrets, il est difficile de s'assurer de ce qu'ils font. S'ils étaient couverts par des licences autorisant leur étude et fournis avec leur code source, alors il serait possible de se faire un avis", ajoute-t-il. De son côté, Microsoft a annoncé début mai que son assistant vocal Cortana pourrait être intégré au sein du système Alexa d'Amazon. Pas forcément rassurant, lorsqu'on pense à l'expérience de Julie.

5Est-ce que je peux éteindre ton micro ?

Surprise : il n’existe pas de bouton "marche/arrêt" sur ces enceintes. Une fois branchées et connectées, elles fonctionnent. Il est toutefois possible de désactiver cette oreille indiscrète qui reste en veille dans votre salon. La Google Home arbore d'ailleurs un seul bouton physique sur sa coque blanche immaculée : celui pour couper le micro. Même chose du côté d’Amazon Echo : l'un des quatre boutons situés sur le haut de l'appareil permet d'éteindre le micro. Le cercle lumineux passe alors au rouge. Côté Apple, le design semble avoir pris le dessus : aucun bouton physique n'est apparent sur le HomePod. Il est pourtant possible de couper les six microphones de l'enceinte en désactivant l'option depuis un iPhone ou en lui demandant… à l'oral : "Dis, Siri, arrête d'écouter".

Sur le papier, donc, l'utilisateur n'est pas obligé de débrancher son enceinte pour s'acheter de l'intimité. Mais le risque zéro n'existe pas. La Cnil préconise même quelques mesures aux utilisateurs : débrancher les appareils en présence d'enfants ou de personnes invitées, vérifier les réglages dans les paramètres de votre compte et ne pas connecter les enceintes à de trop nombreux services en ligne.

Il n'y a aucun moyen d'être complètement sûr que les enceintes n'enregistrent pas, à part en les débranchant

Geoffrey Delcroix, membre du Laboratoire d'innovation numérique de la Cnil
à franceinfo

Quelques règles de bon sens utiles, d'autant que ces enceintes risquent sûrement d'évoluer. Dans un brevet déposé en 2015, Google décrivait un système domestique connecté qui pourrait identifier des émotions à travers "des signes audio comme des pleurs, des rires, ou des cris", et qui pourrait par exemple envoyer une notification lorsqu'un enfant seul chez lui se comporterait de manière inhabituelle. Avec un micro installé dans son salon, on n'est jamais trop prudent.