Cet article date de plus de trois ans.

Enquête "Certains articles sont objectivement faux" : comment les revues scientifiques sont de plus en plus victimes de fraudes

Faux articles, faux auteurs ou textes douteux générés par des algorithmes... Certaines études scientifiques arrivent parfois à tromper des revues scientifiques, y compris les plus sérieuses.

Anne-Laure Barral - Cellule investigation de Radio France

Radio France

Publié le 05/11/2021 12:30 Mis à jour le 06/11/2021 18:09

Temps de lecture : 13min

Les fausses études scientifiques se multiplient. En cause : l’écriture de textes automatique ou encore le manque de relecteurs spécialisés. (DANA NEELY / STONE RF)

On trouve de plus en plus de publications scientifiques frauduleuses produites par des logiciels. Elles réussissent parfois à duper des revues scientifiques. Le Covid-19 a-t-il servi d’accélérateur à la publication de fausses études scientifiques ? Rien que sur le coronavirus, plus de 600 000 études ont été produites en 2020. Certaines ont été publiées dans des journaux scientifiques et revues par un comité de lecture, d’autres plus simplement sur des plateformes Internet, comme BioRxiv ou MedRxiv [sites en anglais]. Mais le problème c’est que souvent, sous la pression de l’urgence, les chercheurs ont mis directement en ligne leurs travaux. "C’est comme si on avait accès à un brouillon de recherche", explique Guillaume Cabanac, maître de conférences en informatique à l’université de Toulouse.

Certes, ces études parfois parcellaires ont permis de répondre rapidement à de nombreuses questions : comment le virus attaque notre système immunitaire ? Comment se diffuse-t-il dans les lieux clos ? Mais on a médiatisé prématurément des recherches qui n’étaient pas abouties, et dont certains résultats se sont révélés faux. Là où le processus de relecture et de contrôle par des pairs prend des mois, il a parfois été réalisé en quelques jours. Résultat : selon le site Retraction Watch [site en anglais], 40 000 études ont été rétractées, dont plus de 190 sur le Covid-19.

Des générateurs automatiques de texte

Mais il y a plus grave : selon le rapport de Pierre Corvol publié en 2016, les études frauduleuses représentent désormais près de 2% des études publiées chaque année. Cela peut sembler peu, mais sur 600 000 études consacrées au Covid-19, il en existerait de fait 12 000 potentiellement frauduleuses.

Exemple d’une "étude" générée automatiquement, cosignée par Anne-Laure Barral, journaliste de la cellule investigation de Radio France, et... Albert Einstein.  (MATHGEN / CELLULE INVESTIGATION DE RADIO FRANCE) — Exemple d’une "étude" générée automatiquement, cosignée par Anne-Laure Barral, journaliste de la cellule investigation de Radio France, et... Albert Einstein. (MATHGEN / CELLULE INVESTIGATION DE RADIO FRANCE)

Il est d’autant plus facile d’en produire aujourd’hui qu’il existe de nouveaux outils numériques pour le faire. L’informaticien français Cyril Labbé, maître de conférences en informatique à l’université Grenoble Alpes, s’est fait connaître en créant un personnage fictif : Ike Antkare. Cet avatar est devenu en 2010 plus cité qu’Albert Einstein. "J’ai utilisé SciGen, un générateur automatique de textes scientifiques, créé par des étudiants du MIT en 2005 pour tester la qualité de conférences scientifiques, explique le professeur. Le résultat est un très beau texte dans un bon anglais mais qui n’a aucun sens."

Pour aider ses confrères à repérer les faux articles, l’informaticien a ensuite créé un logiciel appelé SciDetect. Pourtant, cette année encore, avec son collègue Guillaume Cabanac, il a identifié plusieurs centaines d’études générées par algorithme, dans des revues scientifiques. C’est le cas notamment d’une pseudo étude consacrée à la "surveillance de l’écosystème marin par capteurs wifi et musique traditionnelle" [site en anglais]. Aussi improbable qu’elle soit, elle a été publiée dans la revue Arabian Journal of Geosciences, qui appartient au géant de l’édition scientifique Springer. Plusieurs mois après avoir été signalée, elle a finalement été retractée début novembre. Et le phénomène risque de s’amplifier, car les systèmes de générateurs de textes automatiques ne cessent de progresser avec l’avènement de la famille des GPT (transformateur génératif pré-entraîné), un modèle de langage développé par la société OpenIA d’Elon Musk.

De fausses études sont aussi proposées à l’échelle industrielle. Elisabeth Bik, microbiologiste néerlandaise a découvert, avec d’autres chercheurs, l’existence d’un business de production de faux articles scientifiques : les "paper mills" (traduction : "usines à papiers"). Des entreprises cachées dans l’anonymat relatif d’Internet proposent de faux papiers scientifiques contre rémunération. "Certains articles sont objectivement faux, affirme-t-elle. L’un d’entre eux, consacré au cancer de la prostate, affirme que la moitié des patients sont des femmes."

Capture d’écran d’un site proposant d’acheter une place d’auteur pour une étude sur le cancer.  (SCIENCE PUBLISHER COMPANY) — Capture d’écran d’un site proposant d’acheter une place d’auteur pour une étude sur le cancer. (SCIENCE PUBLISHER COMPANY)

La jungle des revues "prédatrices"

Un autre acteur est venu brouiller les cartes : les revues "prédatrices". Elles viennent concurrencer de grands éditeurs historiques comme Wiley, Springer Nature, Taylor & Francis, ou encore Elsevier qui possède The Lancet. Aujourd'hui, ils pèsent lourd sur le marché, à côté de sociétés savantes qui détiennent aussi leur maison d’édition et leurs revues scientifiques comme IOP Publishing [site en anglais]. Les universités doivent leur payer de très coûteux abonnements à ces prestigieuses revues scientifiques afin que leurs étudiants et chercheurs y aient accès.

A contrario, les éditeurs "prédateurs", eux, proposent de faire payer moins cher les chercheurs pour publier leur article. Et ils leur promettent de fortes retombées, avec une relecture sérieuse par les pairs. Mais ce contrôle n’est pas effectué. Dans les faits, en 24 heures, un article peut être accepté, même s’il n’a aucun sens. Parfois, les membres de ces soi-disant comités éditoriaux n’existent même pas, ou sont décédés depuis longtemps. Pour duper les chercheurs, certaines de ces revues jouent aussi sur l’ambiguïté : elles choisissent un titre proche de celui d’une revue réputée. Identifier ces acteurs prédateurs n’est pas chose facile.

De nombreuses ressources sur les #RevuesPrédatrices sont disponibles sur le nouveau site web publié par @_Journalology
✅ Un exemple : des conseils sur la démarche à adopter si l’on pense avoir soumis un article à une #RevuePrédatrice https://t.co/ZbsFlEdeft
— Open Science Pasteur (@OpenSci_Pasteur) October 1, 2021

Pour alerter ses confrères, le bibliothécaire de l’université de Denver (Colorado), Jeffrey Beall, a bien tenté d’établir une liste de ces revues, qui est devenue une référence internationale. Mais il s’est retrouvé menacé de poursuites. Il a donc dû la retirer. Aujourd’hui, seule la société Cabell’s [site en anglais] a établi un classement de plus de 14 000 titres douteux, selon Hervé Maisonneuve du blog Rédactions Médicales. Mais elle fait payer si cher l’accès à son service qu’aucune université française n’y est abonnée.

Des revues sérieuses qui se font berner

Même dans des revues pour lesquelles il existe un comité de lecture, des études frauduleuses peuvent berner les pairs. C’est ce qui est arrivé au journal médical The Lancet en juin 2020. Une étude consacrée aux risques sur la santé de l’hydroxychloroquine à partir de données recueillies par l’entreprise Surgisphere a dû être retractée quelques semaines après sa publication, compte tenu de l’existence de soupçons sur l’origine des données. "Après l’affaire Surgisphere, nous avons dû changer nos politiques éditoriales, reconnait Naomi Lee, médecin, rédactrice en chef au Lancet, Nous demandons maintenant à ce qu’il soit très clairement spécifié quel auteur de l’étude a eu accès aux données brutes, et qu’il soit bien le garant de ces données."

Chérifa Boukacem-Zeghmouri, professeure des universités en sciences de l'information et de la communication à l'Université Lyon 1, renchérit : "Il y a aujourd’hui une crise des relecteurs. Il y a beaucoup plus d’auteurs, en Chine, en Asie, en Afrique. Mais le nombre d’experts n’a pas autant augmenté."

Des sanctions rares malgré les signalements

Quand il y a soupçon de fraude, les revues sont souvent contactées par des lanceurs d’alerte. Mais elles ne font pas d’investigation elles-mêmes. Elles demandent à l’auteur ou à son laboratoire de s’en charger. Quelques pays comme les États-Unis, le Danemark ou la Suède sont dotés d’organismes indépendants d’enquête sur l’intégrité scientifique. En France, c’est un "référent intégrité scientifique" au sein de chaque organisme de recherche ou université qui doit conduire l’enquête.

Rémy Mosseri, référent au CNRS reconnaît avoir eu 120 signalements, 66 saisines, et a dû rédiger une vingtaine de rapports pour défaut d’intégrité scientifique depuis le début de sa mission en 2018. "Près de la moitié des cas concerne la biologie. Plus d’un tiers des questions de plagiat, 20% des cas relèvent de manipulations de données scientifiques, et il y a un nombre important de désaccords sur qui doit signer les études", explique le physicien. Une commission administrative paritaire se prononce ensuite sur d’éventuelles sanctions. Selon la direction du CNRS, en trois ans, quatre sanctions ont été prononcées, et une personne n’a pas obtenu sa titularisation, suite à des plagiats, fabrications ou falsifications de données.

Un risque de décrédibilisation de la science

Si le nombre de fausses études publiées ne cesse d’augmenter, c’est parce que pour certains, le système est devenu un "pousse au crime". Publier son travail permet certes de faire connaître sa recherche pour construire un socle de connaissances commun, mais c’est aussi un moyen d’obtenir des financements pour ses recherches dans un monde de plus en plus compétitif. Le poids pris par le classement de Shanghaï, qui publie depuis 2003 la liste des universités et instituts de recherche les plus prestigieux en fonction du nombre de citations des publications de leurs chercheurs, a accentué cette pression.

Mais la publication de ces fausses études peut être dommageable pour les scientifiques, et pour les citoyens eux-mêmes. On l’a vu avec l’affaire de la méta-analyse d’Andrew Hill sur l’ivermectine. Ce pharmacologue de l’université de Liverpool avait compulsé les méthodes et les résultats d’une vingtaine d’essais cliniques sur plus de 3 000 patients traités avec cet antiparasitaire contre le Covid-19. Son analyse en janvier dernier estimait que ce traitement réduisait la mortalité de 56%, et devait être prescrit en dehors des essais cliniques. Certaines personnes ont alors pris de l’ivermectine pensant éviter la maladie. En regardant de plus près les données de certains essais cliniques notamment en Égypte, en Iran, et encore récemment au Liban, les chercheurs ont cependant identifié des fraudes. "Nous ne voyons aucun effet de l'ivermectine sur la survie, ni sur la récupération clinique", a dû admettre Andrew Hill à la presse britannique.

Manifestations en Afrique du Sud pour que l’ivermectine soit utilisée comme traitement contre la Covid-19, en janvier 2021. (GALLO IMAGES / GALLO IMAGES EDITORIAL / GETTY IMAGES)

De son côté, Patricia Murray, professeure à l’université de Liverpool, s’inquiète de la non-rétractation d’une étude écrite notamment par un chirurgien italien, Paolo Macchiarini, et publiée dans The Lancet en 2008. Il est aujourd’hui mis en cause pour fraude dans le cadre de plusieurs autres études consacrées à une technique d’opération de la trachée. Plusieurs de ses patients sont morts. "Certains médecins dans d’autres pays peuvent se dire, en s’appuyant sur cet article, que c’est une technique qui marche et qu’ils peuvent la tenter sur leurs patients", déplore la lanceuse d’alerte. Le risque à terme, c’est que l’image même de la science soit endommagée, que le public perde confiance dans ses méthodes, et se détourne du rationnel pour se réfugier dans la croyance.

: Enquête "Certains articles sont objectivement faux" : comment les revues scientifiques sont de plus en plus victimes de fraudes

Des générateurs automatiques de texte

La jungle des revues "prédatrices"

Des revues sérieuses qui se font berner

Des sanctions rares malgré les signalements

Un risque de décrédibilisation de la science

Enquête "Certains articles sont objectivement faux" : comment les revues scientifiques sont de plus en plus victimes de fraudes