En exploitant les failles du système de signalement d’atteinte au droit d’auteur de Google, des officines spécialisées parviennent à invisibiliser des enquêtes journalistiques, menaçant ainsi la liberté d’informer.
par Thibaut Schepman – Publié le 08 janvier 2025 sur le site de l’INA
« Le journalisme, c’est le fait de publier quelque chose que quelqu’un ne voudrait pas que l’on publie. Tout le reste n’est que relations publiques », aurait écrit George Orwell (la citation est probablement apocryphe). Si l’on en croit l’écrivain britannique, voir quelqu’un tenter de faire supprimer l’un de ses articles serait donc un motif de reconnaissance pour tout journaliste. Mais c’est aussi un motif de grande frustration quand ça fonctionne.
C’est ce qui est arrivé à la journaliste Fanny Ruz-Guindos, qui a découvert « par hasard » que l’une de ses enquêtes pour Le Canard enchaîné avait tout simplement « disparu de Google ». Ce qui revient à peu près à dire qu’elle a disparu tout court, en tout cas pour la majorité des lecteurs et lectrices qui ne disposent pas du lien exact de l’article.
Pratiques déloyales
L’histoire commence fin juillet, quand elle co-écrit avec la journaliste Anne Jouan un article racontant que le chirurgien esthétique Olivier Gerbault est accusé d’avoir charcuté des patients (l’Association des réussites et des ratés de la chirurgie esthétique, Arches, a recensé une dizaine de plaintes ; un groupe Facebook réunit plus de 250 victimes autoproclamées), d’avoir exercé la médecine de façon illégale (le conseil de l’Ordre, qui l’avait radié, a signalé ces faits au procureur de la République) et d’avoir eu recours avec son fils à des pratiques déloyales en termes d’e-réputation (il a été condamné sur ce point et s’est pourvu en cassation). Une fois l’article publié, la journaliste s’en va s’intéresser à d’autres sujets. Mais le 24 novembre, une de ses sources lui apprend qu’un autre média a publié, deux jours plus tôt, peu ou prou la même enquête en la présentant comme exclusive. Un peu désappointée, elle tape dans Google le nom d’Olivier Gerbault pour lire l’article en question. C’est là qu’elle découvre que sa propre enquête est désormais introuvable sur le web.
Pourquoi donc ? Tout simplement parce qu’une personne ne voulant pas que son article soit accessible a demandé à Google de le désindexer. Google s’est exécuté. La journaliste l’a réalisé en consultant la base de données Lumen Database, qui est gérée par un centre de recherche de l’université Harvard et qui vise justement à recueillir et à rendre publique les demandes de suppression de contenus en ligne sur certaines plateformes. La requête avance que son article aurait enfreint les règles du copyright : il serait un plagiat d’un article publié précédemment sur ID 2 Santé, un site web qui assure fournir « des conseils et des informations sur les dernières actualités en matière de santé ».
Tromper Google
Cette accusation n’est pas crédible une seule seconde, pointe Fanny Ruz-Guindos : « L’article d’ID 2 Santé que j’aurais plagié est présenté comme ayant été publié le 16 mai dernier. Mais c’est impossible, une partie des faits dont je parle dans mon article datent d’après cette date, j’écris par exemple qu’Olivier Gerbault a été radié le 19 juin. » Une seule explication possible : quelqu’un a antidaté l’article d’ID 2 Santé de manière mensongère, afin de tromper Google et de faire cette fausse dénonciation.
La pratique vous semble particulièrement retorse ? Elle n’est pourtant pas nouvelle et bon nombre de personnes ayant en général des choses graves à se reprocher (ce qui recoupe des affaires criminelles, de la corruption et des scandales financiers) y ont déjà eu recours. Dès 2021, l’ONG suédoise Qurium documentait comment cette méthode avait permis de passer sous silence une enquête consacrée à l’un des volets de l’affaire des Panama Papers. On découvrait, grâce à l’ONG, l’offre commerciale d’une entreprise qui vendait ce genre de services : « Ce que nous ne pouvons pas supprimer, nous le désindexerons des moteurs de recherche […] en garantissant la protection de votre nom. »
1 500 dollars l’opération
En février 2023, une enquête « cross-border » (transfrontalière) menée par Forbidden Stories révélait ensuite les méthodes d’Eliminalia, une entreprise espagnole au chiffre d’affaires millionnaire spécialisée dans la suppression de contenus en ligne dans le monde entier. Son astuce : créer de faux sites web et falsifier ou antidater des dates de publication pour exploiter les failles des systèmes de dénonciation DMCA.(1) Ça vous rappelle quelque chose ? En juillet dernier, le média péruvien Ojo Público publiait encore une enquête sur une tentative de suppression… de deux de ses propres enquêtes. Elle démontrait que les spécialistes de e-réputation à la manœuvre étaient très probablement basés en Inde et facturaient 1 500 dollars l’effacement de référencement de contenus dans les moteurs de recherche.
Et en France ? Nous avons épluché la base de données Lumen pour en savoir plus.(2) La plupart du temps, ces demandes sont anonymes ou déposées sous des noms inventés. Sauf de rares exceptions, comme cette demande de retrait datant de juin 2023 qui concerne une enquête de La Lettre A consacrée à la proximité entre l’essayiste multicondamné Éric Zemmour et certaines personnalités africaines et qui est signée du nom Agacompi, comme l’une des agences de communication citées dans l’article.
Manœuvre bâillon
Certaines tendances fortes se dégagent tout de même. Ainsi, on constate qu’à trois reprises, en 2022, un article visant déjà les pratiques d’Olivier Gerbault et d’un de ses enfants a été visé par une demande de retrait. Décidément, quelqu’un semble avoir très envie que les reproches faits à ce chirurgien restent méconnus.
D’autres conclusions de ce type se dégagent grâce à l’analyse de cette base de données. En octobre 2023 et octobre 2024, plusieurs articles de La Voix du Nord racontant les déboires judiciaires d’une grande chaîne de restauration locale accusée de travail dissimulé et de fraude aux cotisations sociales ont subi les mêmes demandes répétées. Une tentative de manœuvre bâillon ? Entre 2019 et 2021, des dizaines de requêtes ont par ailleurs visé une petite dizaine d’articles consacrés à ce qu’on a appelé le « Kazakhgate » — une affaire de corruption concernant des contrats militaires conclus entre la France et le Kazakhstan sous la présidence de Nicolas Sarkozy (récemment condamné dans l’affaire Paul Bismuth et en attente de la décision de la Cour de cassation dans l’affaire Bygmalion), dont plusieurs proches sont mis en cause. Des articles du Monde, de Libération, du Figaro ou de L’Express ont ainsi été visés par ces demandes de retrait sous des prétextes qui semblent tout à fait fallacieux. Qui peut bien en être à l’origine ? Tout au plus peut-on remarquer que la fiche Wikipédia du Kazakhgate comporte une alerte indiquant qu’elle a été modifiée afin de présenter les faits de façon favorable à Patokh Chodiev, un milliardaire Kazakh qui aurait selon Mediapart séduit le clan Sarkozy à coups de dîner et montre de luxe. On constate également que certains sites d’information, dont Le Monde, sont visés par des dénonciations par centaines d’articles qui semblent choisis de façon aléatoire. Est-ce une technique cherchant à nuire à leur référencement global sur Google ? À plusieurs reprises, des représentants de Google ont en effet expliqué vouloir sanctionner les sites Internet qui seraient ciblés par de multiples requêtes DMCA.
« On a l’impression d’être soumis à la décision des robots »
À plus ou moins grande échelle, toute la profession semble visée par des procédures de ce type, du site Les Jours à Streetpress en passant par Jeune Afrique ou L’Opinion. Mais d’après notre analyse, le site français plus souvent visé n’est pas un média mais une plateforme collaborative de signalements concernant les escroqueries : Signal-Arnaques. Son cofondateur, Jean-Baptiste Boisseau, nous confirme : « On n’en a jamais parlé publiquement, mais ces stratagèmes sont vraiment l’un des gros cailloux dans notre chaussure depuis trois à cinq ans. C’est l’un des outils les plus faciles à utiliser dans l’arsenal qui est utilisé pour nous faire taire. On a l’impression que les escrocs peuvent utiliser cent fois la même technique, les cent fois Google tombera dedans. » Il assure se sentir démuni face à ce stratagème : « On reçoit une notification quand on est visé par ces requêtes mais souvent c’est trop tard, il y a déjà déréférencement. On nous propose alors de nous défendre avec un formulaire à remplir. Mais on a l’impression d’être soumis à la décision des robots, parfois ça marche, parfois non, on n’a jamais d’explication. »
« Coquille vide »
Tout le monde n’est pas logé à la même enseigne en la matière. Entre mars et juin dernier, un article bien particulier du Monde.fr a fait l’objet à douze reprises de demandes de déréférencement sous le prétexte mensonger d’atteinte au copyright. Il s’agissait d’une enquête dévoilant… le fonctionnement de l’industrie de la désinformation. Alerté par un confrère fin avril, le journaliste du Monde Damien Leloup a alors immédiatement signalé le problème à Google : « Ça m’a pris trente secondes pour constater que la demande était faite au nom d’une structure qui n’existe pas. J’ai transmis les éléments à Google de façon informelle, via un contact que j’ai à la com’. En quelques jours, c’était rétabli, l’article était à nouveau référencé. » Que pense ce journaliste du rôle de Google dans l’affaire ? D’une part, il dit avoir conscience que les demandes DMCA réalisées pour nuire à la liberté d’informer sont extrêmement minoritaires dans le lot des demandes reçues par Google. D’une autre, il souligne que « des vérifications de base suffisent pour voir que la demande était illégitime. »
C’est ce que souligne également la journaliste du Canard Fanny Ruz-Guindos, qui estime que le travail de vérification fait par Google n’a pas été à la hauteur dans la procédure de déréférencement de son article (son article est à nouveau référencé depuis le vendredi 6 décembre et la suppression par ID 2 Santé de son propre article prétendument plagié par Le Canard). Elle a par exemple facilement constaté que le site ID 2 Santé est « une coquille vide basée au Royaume-Uni ». Petite astuce maison pour Google : nous avons utilisé son propre outil de recherche d’image (Google Lens) pour s’apercevoir que la prétendue journaliste du prétendu média ID 2 Santé se présente avec une photo visiblement bidon et utilisée entre autres sur tout un tas de sites d’arnaques en ligne.
Couac
Contacté à ce sujet, un porte-parole de Google nous a répondu par mail en nous assurant que l’entreprise « lutte activement contre les tentatives frauduleuses de suppression de contenu ». Elle assure que ses moyens de lutte comprennent : « une combinaison de systèmes automatisés et d’examens humains pour détecter les signaux d’abus, y compris l’identification de tactiques bien connues telles que l’anti-datage. » L’entreprise n’en dit pas beaucoup plus « pour ne pas donner d’armes à ceux qui abusent ».
Ces actions de Google semblent régulièrement porter leurs fruits. L’ensemble des publications citées dans cet article sont correctement référencées aujourd’hui. L’auteur de ces lignes a vu l’un de ses articles, désindexé depuis plus de deux ans, être à nouveau référencé ces dernières semaines. La récente suppression de l’article du Canard reste toutefois un gros couac. Elle marquera forcément un précédent. Le journal d’investigation a en effet annoncé porter plainte auprès du procureur de la République pour contrefaçon, escroquerie, faux et usage de faux et déposer une requête pour identifier le ou les personnes aux manettes derrière ID 2 Santé. Pour la première fois à notre connaissance, un média français entend dénoncer devant les tribunaux cette atteinte à la liberté d’informer.
Thibaut Schepman
Journaliste