Dépollution de la littérature scientifique : traque de la fake science avec le Problematic Paper Screener
Le problème du ‘fake’ n’épargne pas la science. Imaginez lire du texte dénué de sens tel que invulnerable framework, glucose bigotry et nucleic corrosive* dans un article scientifique publié par une maison d’édition de référence comme Elsevier, Springer ou Wiley. Nous avons identifié 20k articles contenant de telles expressions torturées produites par des outils paraphrasant des publications authentiques pour passer sous les radars des détecteurs de plagiat. Ce problème affecte 3/10.000 articles publiés en 2021. Les fraudeurs produisent ces articles non fiables ou les achètent auprès de paper mills.
Cette conférence présentera comment des « détectives scientifiques » identifient les problèmes, les signalent, font rétracter des centaines d’articles et suivent les liens de citation pour freiner la propagation des erreurs grâce au Problematic Paper Screener : un site web public qui passe au peigne fin les 150 millions d’articles produits à ce jour.
*Au lieu de immune system, glucose intolerance et nucleic acid.
Guillaume Cabanac est professeur d’informatique à l’Université de Toulouse et membre de l’Institut de recherche en informatique de Toulouse (IRIT UMR 5505 CNRS). Il est titulaire d’une chaire de recherche fondamentale de l’Institut universitaire de France (IUF) intitulée « dépollution de la littérature scientifique ». Ses travaux visent à identifier des publications non fiables par fouille de textes, notamment au sein du projet ERC Synergy ‘Nanobubbles’ questionnant le processus d’autocorrection de la science. Il développe le ‘Problematic Paper Screener’ qui traque des publications non fiables, pourtant publiées et souvent vendues par les maisons d’édition de premier plan. Au quotidien, ses signalements d’articles problématiques, contenant notamment des expressions torturées, ont donné lieu à plus de 3 500 rétractations. Sa recherche a été distinguée dans le palmarès “Nature’s 10” présentant « dix personnes qui ont contribué à façonner la science en 2021 » selon la revue Nature.
Abalkina, A., Aquarius, R., Bik, E., Bimler, D., Bishop, D., Byrne, J., Cabanac, G., Day, A., Labbé C., & Wise, N. (2025). ‘Stamp out paper mills’ — Science sleuths on how to fight fake research [Comment]. In Nature (Vol. 637, Issue 8048, pp. 1047–1050). https://doi.org/10.1038/d41586-025-00212-1
Cabanac, G. (2024). Chain retraction: How to stop bad science propagating through the literature [Comment]. In Nature (Vol. 632, Issue 8027, pp. 977–979). https://doi.org/10.1038/d41586-024-02747-1
Cabanac, G. (2021). This digital-hygiene routine will protect your scholarship [World View: A personal take on science and society]. In Nature (Vol. 598, Issue 7882, p. 541). https://doi.org/10.1038/d41586-021-02901-z
Cabanac, G., & Labbé, C. (2021). Prevalence of nonsensical algorithmically generated papers in the scientific literature. In Journal of the Association for Information Science and Technology (Vol. 72, Issue 12, pp. 1461–1476). https://doi.org/10.1002/asi.24495
Cabanac, G., Labbé, C., & Magazinov, A. (2021). Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues aLecting established journals. arXiv preprint. https://arxiv.org/abs/2107.06751
Kwon, D. (2021). Guillaume Cabanac: Deception Sleuth. [Nature’s 10: Ten people who helped shape science in 2021]. In Nature (Vol. 600, Issue 7890, p. 602). https://doi.org/10.1038/d41586-021-03621-0
Graña Possamai, C., Cabanac, G., Perrodeau, E., Ghosn, L., Ravaud, P., & Boutron, I. (2025). Inclusion of retracted studies in systematic reviews and meta-analyses of interventions. In JAMA Internal Medicine. https://doi.org/10.1001/jamainternmed.2025.0256