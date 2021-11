De plus en plus de fausses études scientifiques sont produites par des logiciels. Si elles sont encore imparfaites, elles arrivent parfois à tromper des revues scientifiques, y compris les plus sérieuses.

On trouve de plus en plus de publications scientifiques frauduleuses produites par des logiciels. Elles réussissent parfois à duper des revues scientifiques. Le Covid-19 a-t-il servi d’accélérateur à la publication de fausses études scientifiques ? Rien que sur le coronavirus, plus de 600 000 études ont été produites en 2020. Certaines ont été publiées dans des journaux scientifiques et revues par un comité de lecture, d’autres plus simplement sur des plateformes Internet, comme BioRxiv ou MedRxiv [sites en anglais]. Mais le problème c’est que souvent, sous la pression de l’urgence, les chercheurs ont mis directement en ligne leurs travaux. "C’est comme si on avait accès à un brouillon de recherche", explique Guillaume Cabanac, maître de conférences en informatique à l’université de Toulouse.



Certes, ces études parfois parcellaires ont permis de répondre rapidement à de

nombreuses questions : comment le virus attaque notre système immunitaire ? Comment se diffuse-t-il dans les lieux clos ? Mais on a médiatisé prématurément des recherches qui n’étaient pas abouties, et dont certains résultats se sont révélés faux. Là où le processus de relecture et de contrôle par des pairs prend des mois, il a parfois été réalisé en quelques jours. Résultat : selon le site Retraction Watch [site en anglais], 40 000 études ont été rétractées, dont plus de 190 sur le Covid-19.

De véritables fraudes



Mais il y a plus grave : selon le rapport de Pierre Corvol publié en 2016, les

études frauduleuses représentent désormais près de 2 % des études publiées

chaque année. Cela peut sembler peu, mais sur 600 000 études consacrées au

Covid-19, il en existerait de fait 12 000 potentiellement frauduleuses.



Exemple d’une étude générée automatiquement, signée par Anne-Laure Barral et Albert Einstein. (MATHGEN / CELLULE INVESTIGATION DE RADIO FRANCE)



Il est d’autant plus facile d’en produire aujourd’hui qu’il existe de nouveaux

outils numériques pour le faire. L’informaticien français, Cyril Labbé, maître de

conférences en informatique à l’université Grenoble Alpes, s’est fait connaître

en créant un personnage fictif : Ike Antkare. Cet avatar est devenu en 2010 plus

cité qu’Albert Einstein. "J’ai utilisé SciGen, un générateur automatique de

textes scientifiques, créé par des étudiants du MIT en 2005 pour tester la qualité

de conférence scientifique, explique le professeur. Le résultat est un très beau

texte dans un bon anglais mais qui n’a aucun sens."

Pour aider ses confrères à repérer les faux articles, l’informaticien a ensuite créé un logiciel appelé SciDetect. Pourtant, cette année encore, avec son collègue Guillaume Cabanac, il a identifié plusieurs centaines d’études générées par algorithme, dans des revues scientifiques. C’est le cas notamment d’une pseudo étude consacrée à la "surveillance de l’écosystème marin par capteurs wifi et musique traditionnelle" [site en anglais]. Aussi improbable qu’elle soit, elle a été publiée dans la revue Arabian Journal of Geosciences, qui appartient au géant de l’édition scientifique Springer. Plusieurs mois après avoir été signalée, elle a finalement été retractée début novembre. Et le phénomène risque de s’amplifier, car les systèmes de générateurs de textes automatiques ne cessent de progresser avec l’avènement de la famille des GPT (transformateur génératif pré-entraîné), un modèle de langage développé par la société OpenIA d’Elon Musk.

Des usines à fausses études



De fausses études sont aussi proposées à l’échelle industrielle. Elisabeth Bik, microbiologiste néerlandaise a découvert, avec d’autres chercheurs,

l’existence d’un business de production de faux articles scientifiques : les

"paper mills" (traduction : "usines à papiers"). Des entreprises cachées dans

l’anonymat de la jungle d’Internet proposent de faux papiers scientifiques contre rémunération. "Certains articles sont objectivement faux, affirme-t-elle. L’un d’entre eux, consacré au cancer de la prostate, affirme que la moitié des patients sont des femmes."

Capture d’écran d’un site proposant d’acheter une place d’auteur pour une étude sur le cancer. (SCIENCE PUBLISHER COMPANY)







La jungle des revues prédatrices



Un autre acteur est venu brouiller les cartes : les "revues prédatrices". Elles

viennent concurrencer de grands éditeurs historiques comme Wiley, Springer Nature, Taylor & Francis, ou encore Elsevier qui possède The Lancet. Aujourd'hui, ils pèsent lourd sur le marché, à côté de sociétés savantes qui détiennent aussi leur maison d’édition et leurs revues scientifiques comme IOP Publishing [site en anglais]. Les universités doivent leur payer de très coûteux abonnements à ces prestigieuses revues scientifiques afin que leurs étudiants et chercheurs y aient accès.



A contrario, les éditeurs "prédateurs", eux, proposent de faire payer moins

cher les chercheurs pour publier leur article. Et ils leur promettent de fortes

retombées, avec une relecture sérieuse par les pairs. Mais ce contrôle n’est pas

effectué. Dans les faits, en 24 heures, un article peut être accepté, même s’il n’a

aucun sens. Parfois les membres de ces soi-disant comités éditoriaux n’existent même pas, ou sont décédés depuis longtemps. Pour duper les chercheurs, certaines de ces revues jouent aussi sur l’ambiguïté : elles choisissent un titre proche de celui d’une revue réputée. Identifier ces acteurs prédateurs n’est pas chose facile.

De nombreuses ressources sur les #RevuesPrédatrices sont disponibles sur le nouveau site web publié par @_Journalology

✅ Un exemple : des conseils sur la démarche à adopter si l’on pense avoir soumis un article à une #RevuePrédatrice https://t.co/ZbsFlEdeft — Open Science Pasteur (@OpenSci_Pasteur) October 1, 2021



Pour alerter ses confrères, le bibliothécaire de l’université de Denver dans le

Colorado, Jeffrey Beall, a bien tenté d’établir une liste de ces revues, qui est

devenue une référence internationale. Mais il s’est retrouvé menacé de

poursuites. Il a donc dû la retirer. Aujourd’hui, seule la société Cabell’s [site en anglais] a établi un classement de plus de 14 000 titres douteux, selon Hervé Maisonneuve du blog Rédactions Médicales. Mais elle fait payer si cher l’accès à son service qu’aucune université française n’y est abonnée.

Même des revues sérieuses se font berner



Même dans des revues pour lesquelles il existe un comité de lecture, des études

frauduleuses peuvent berner les pairs. C’est ce qui est arrivé au journal médical

The Lancet en juin 2020. Une étude consacrée aux risques sur la santé de l’hydroxychloroquine à partir de données recueillies par l’entreprise Surgisphere, a dû être retractée quelques semaines après sa publication, compte tenu de l’existence de soupçons sur l’origine des données. "Après l’affaire Surgisphere nous avons dû changer nos politiques éditoriales, reconnait Naomi Lee, médecin, rédactrice en chef au Lancet, Nous demandons maintenant à ce qu’il soit très clairement spécifié quel auteur de l’étude a eu accès aux données brutes, et qu’il soit bien le garant de ces données."

Chérifa Boukacem, professeure des universités en sciences de l'information et de la communication à l'Université Lyon 1 renchérit : "Il y a aujourd’hui une crise des relecteurs. Il y a beaucoup plus d’auteurs, en Chine, en Asie, en Afrique. Mais le nombre d’experts n’a pas autant augmenté."



Quatre sanctions pour 120 signalements



Quand il y a soupçon de fraude, les revues sont souvent contactées par des lanceurs d’alerte. Mais elles ne font pas d’investigation elles-mêmes. Elles

demandent à l’auteur ou à son laboratoire de s’en charger. Quelques pays

comme les États-Unis, le Danemark ou la Suède sont dotés d’organismes

indépendants d’enquête sur l’intégrité scientifique. En France, c’est un "référent

intégrité scientifique" au sein de chaque organisme de recherche ou

université qui doit conduire l’enquête.



Rémy Mosseri, référent au CNRS reconnaît avoir eu 120 signalements, 66 saisines, et a dû rédiger une vingtaine de rapports pour défaut d’intégrité scientifique depuis le début de sa mission en 2018. "Près de la moitié des cas concerne la biologie. Plus d’un tiers des questions de plagiat, 20 % des cas relèvent de manipulations de données scientifiques, et il y a un nombre important de désaccords sur qui doit signer les études", explique le physicien. Une commission administrative paritaire se prononce ensuite sur d’éventuelles sanctions. Selon la direction du CNRS, en trois ans, quatre sanctions ont été prononcées, et une personne n’a pas obtenu sa titularisation, suite à des plagiats, fabrications ou falsifications de données.

Un risque de décrédibilisation de la science ?

Si le nombre de fausses études publiées ne cesse d’augmenter, c’est parce que

pour certains, le système est devenu un "pousse au crime". Publier son travail

permet certes de faire connaître sa recherche pour construire un socle de

connaissances commun, mais c’est aussi un moyen d’obtenir des financements

pour ses recherches dans un monde de plus en plus compétitif. Le poids pris par

le classement de Shanghai, qui publie depuis 2003 la liste des universités et

instituts de recherche les plus prestigieux, en fonction du nombre de citations

des publications de leurs chercheurs, a accentué cette pression.



Mais la publication de ces fausses études peut être dommageable pour les

scientifiques, et pour les citoyens eux-mêmes. On l’a vu avec l’affaire de la

méta-analyse d’Andrew Hill sur l’ivermectine. Ce pharmacologue de

l’université de Liverpool avait compulsé les méthodes et les résultats

d’une vingtaine d’essais cliniques sur plus de 3 000 patients traités avec cet

antiparasitaire contre le Covid-19. Son analyse en janvier dernier estimait que ce

traitement réduisait la mortalité de 56 %, et devait être prescrit en dehors des

essais cliniques. Certaines personnes ont alors pris de l’ivermectine pensant

éviter la maladie. En regardant de plus près les données de certains essais cliniques notamment en Égypte, en Iran, et encore récemment au Liban les chercheurs ont cependant identifié des fraudes. "Nous ne voyons aucun effet de l'ivermectine sur la survie, ni sur la récupération clinique", a dû admettre Andrew Hill à la presse britannique.

Manifestations en Afrique du Sud pour que l’ivermectine soit utilisée comme traitement contre la Covid-19, en janvier 2021. (GALLO IMAGES / GALLO IMAGES EDITORIAL / GETTY IMAGES)



De son côté, Patricia Murray, professeure à l’université de Liverpool s’inquiète

de la non-rétractation d’une étude écrite notamment par un chirurgien italien,

Paolo Macchiarini, et publiée dans The Lancet en 2008. Il est aujourd’hui mis en

cause pour fraude dans le cadre de plusieurs autres études consacrées à une

technique d’opération de la trachée. Plusieurs de ses patients sont morts. "Certains médecins dans d’autres pays peuvent se dire, en s’appuyant sur cet article, que c’est une technique qui marche et qu’ils peuvent la tenter sur leurs patients", déplore la lanceuse d’alerte. Le risque à terme, c’est que l’image même de la science soit endommagée, que le public perde confiance dans ses méthodes, et se détourne du rationnel pour se réfugier dans la croyance.