Les médias de désinformation pro-Kremlin référencés par des centaines d’articles Wikipédia
Le Kremlin continue à isoler la population russe du reste du monde en l’empêchant d’accéder à des informations fiables, y compris en adoptant une position de plus en plus agressive vis-à-vis de Wikipédia. Roskomnadzor, le régulateur russe des médias, a affirmé que le site Wikipédia était devenu la source d’«une nouvelle ligne d’attaques constantes contre les Russes» et que ses articles privilégiaient «une interprétation exclusivement antirusse des événements». L’avenir de Wikipédia en Russie est incertain mais, pour l’heure, l’encyclopédie en ligne est toujours accessible.
Wikipédia est l’une des merveilles de notre époque. La taille du site et la vitesse à laquelle il s’est développé forcent l’admiration. Ayant fêté son 20e anniversaire en 2021, il compte plus de 55 millions d’articles dans plus de 300 langues. En plus de se démarquer par la richesse de son contenu, il est également l’un des sites web les plus consultés au monde, se classant à la 10e place selon Alexa, et des pages Wikipédia figurent régulièrement parmi les premiers résultats de recherche sur Google, et ce, sur presque n’importe quel sujet. Le plus surprenant est que le site doit principalement cet exploit à des millions de contributeurs bénévoles dans le monde qui éditent gratuitement l’encyclopédie.
Bien qu’elle soit la plus grande de ce type, nous ne disposons que de très peu d’informations sur sa vulnérabilité à la manipulation des informations. Certains ont avancé que Wikipédia est l’une des plateformes sociales les mieux protégées contre la mésinformation et la désinformation, ce qui pourrait bien être le cas, en raison de sa configuration et de sa politique éditoriale qui diffèrent considérablement de Facebook, YouTube, Twitter, TikTok et d’autres.
Cela étant dit, la configuration collaborative de Wikipédia comporte son lot d’inconvénients. Le manque de gestion descendante sur l’édition entraîne parfois des conflits entre les éditeurs, ce que l’on appelle également des guerres d’édition. Une guerre d’édition survient souvent entre des éditeurs agissant de bonne foi et qui perdent simplement leur sang-froid sur un sujet qui leur tient à cœur. Il existe même une page Wikipédia consacrée aux «guerres d’édition les plus futiles» pour souligner leur caractère inutile mais souvent bienveillant.
Cependant, toutes les éditions ne sont pas réalisées de bonne foi. Un exemple récent illustrant la mauvaise utilisation de l’ouverture de la plateforme est l’infiltration du Wikipédia en langue chinoise, que la Wikimedia Foundation a étudié durant près d’un an. Notons également l’«édition de vengeance», qui consiste à insérer du contenu erroné, partial ou diffamatoire dans des articles, en particulier dans des biographies de personnes en vie.
Des entités sanctionnées aux points de référence dans Wikipédia
Afin de mieux comprendre la vulnérabilité de Wikipédia à la mésinformation involontaire et à la désinformation intentionnelle, nous avons mené une étude pilote l’année dernière centrée sur quatre médias de désinformation pro-Kremlin bien connus – SouthFront, NewsFront, InfoRos et Strategic Culture Foundation. Tous les quatre sont liés aux services de renseignement russes et sont sanctionnés par le Département du Trésor des États-Unis en raison de leurs tentatives d’ingérence dans les élections américaines de 2020.
Avant de nous plonger dans ses conclusions, expliquons la méthodologie suivie. La recherche entendait répondre à trois questions. La première, quel préjudice la référence aux médias de désinformation sélectionnés peut-elle entraîner? La deuxième, les liens vers ces médias sont-ils intentionnels ou résultent-ils d’une simple négligence? La troisième, quelles sont les éventuelles solutions pour réduire leur impact?
Dans un premier temps, un maximum d’articles Wikipédia référençant les domaines en question ont été cartographiés et collectés en utilisant plusieurs sources: la propre recherche de Wikipédia, d’autres moteurs de recherche (Google, Bing, Seznam) et des bases de données de liens retours (Semrush, BuzzSumo). Ensuite, l’historique de révision de tous ces articles a été collecté et analysé afin d’identifier les révisions dans lesquelles des références ont été ajoutées ou supprimées. Enfin, les données ont été traitées pour ajouter des totaux (par exemple, le total actuel de références pour chaque article et pour chaque URL cible unique).
Les résultats
Après avoir analysé le contenu des dizaines de milliers de révisions d’articles pré-identifiés, il est apparu qu’à la fin de l’année 2021, les quatre médias de désinformation ciblés par l’étude ont servi de points de référence dans au moins 625 articles et sont apparus à un moment donné dans au moins 690 articles. La majorité de ces articles font référence à southfront.org (57 pour cent), suivi par news-front.info (27 pour cent).
En ce qui concerne les thèmes, la plupart des articles pertinents portaient sur les conflits au Moyen Orient et comportaient des mots clés comme «Syrie/Syrien», «offensive», «guerre (civile)», mais aussi «Russe» ou «intervention».
La majorité des articles faisant référence à l’un des quatre médias de désinformation pro-Kremlin apparaissent sur cinq versions linguistiques de Wikipédia: russe (136 articles), arabe (70), espagnol (52), portugais (45) et vietnamien (32). Le russe est également l’une des rares langues pour lesquelles news-front.info sert davantage de référence comparé aux trois autres.
À un moment donné, les éditions anglaise et française contenaient elles aussi un grand nombre d’articles renvoyant aux sites web sanctionnés. Toutefois, en décembre 2019, une proposition sur la «Dépréciation des sites de fausses informations/désinformation» a été adoptée, et southfront.org, ainsi que news-front.info ont été interdits. Par la suite, une grande purge a eu lieu, et la plupart des références aux sites web sanctionnés sur la version anglaise de Wikipédia ont été supprimées.
Il est utile de noter la force de l’action individuelle ainsi que l’aspect communautaire de Wikipédia. La décision a en effet été proposée par un seul éditeur et mise en œuvre par des éditeurs expérimentés exerçant certains droits avancés, mais les autres utilisateurs avaient la possibilité de la commenter. Cette approche pourrait aussi être adoptée par des éditeurs d’autres versions linguistiques.
Impact potentiel
Les articles figurant dans l’ensemble de données totalisent en moyenne plus de 88 000 vues par jour. Dix-huit de ces articles comptent plus de 1 000 vues par jour, et cinq d’entre eux contiennent toujours des références aux quatre sites web, y compris l’article le plus consulté, qui est l’article sur l’Iran publié sur le Wikipédia anglais avec plus de 11 000 vues quotidiennes.
Cela étant dit, pris isolément, ces chiffres ne signifient pas grand-chose. Par exemple, la référence employée dans l’article sur l’Iran est un communiqué de presse de l’Organisation de coopération de Shanghai republié par strategic-culture.org. Même s’il s’agit là de deux sources loin d’être impartiales, prises au pied de la lettre, elles constituent une référence valable pour l’information proposée. Une analyse approfondie de chaque référence serait nécessaire pour déterminer leur impact sur l’intégrité factuelle des articles.
Toutefois, ceci illustre une nouvelle fois un problème fréquemment observé avec les sources de désinformation, y compris les médias contrôlés par l’État comme RT et Sputnik: elles proposent souvent une couverture très factuelle des événements qui surviennent dans le monde uniquement pour y glisser des informations partiales ou trompeuses où il faut. Ce qui s’apparente à un compte-rendu sérieux se transforme en un véhicule pour la désinformation.
Cela nous amène au point suivant: l’atteinte potentielle à la réputation pour avoir autorisé le recours à de mauvaises sources. La fiabilité est essentielle pour Wikipédia. Le fait que n’importe qui puisse contribuer à Wikipédia entraîne un examen attentif de sa fiabilité et de sa neutralité qui sont comparées à la fiabilité des encyclopédies traditionnelles.
Afin de clarifier ce qu’est une source fiable, la plupart des éditions linguistiques de Wikipédia alimentent une page «Sources fiables» du Wikipédia anglais, qui fournit des conseils pratiques aux éditeurs. Les médias de désinformation n’y sont pas mentionnés explicitement, mais le terme de «sites de fausses informations contrôlés par l’État» est privilégié: «Certaines sources sont mises sur la liste noire et ne peuvent pas du tout être utilisées. Ce sort est généralement réservé aux sources qui sont ajoutées de manière abusive, comme les sites de fausses informations contrôlés par l’État connus pour leurs ajouts par des usines à trolls.» Il ne s’agit toutefois pas d’une règle absolue, car au moins quelques sources mises sur la liste noire peuvent être localement placées sur la liste blanche, selon Wikipédia.
Une liste «non exhaustive de sources dont la fiabilité et l’utilisation sur Wikipédia sont fréquemment débattues» est mise à jour sur une autre page. Notons que Sputnik et RT sont explicitement répertoriés comme des sources peu fiables, mais il n’est fait aucune mention, par exemple, à SNA, la version allemande renommée de Sputnik. Southfront.org et news-front.info figurent parmi les «sites de fausses informations contrôlés par l’État», mais ne sont pas repris dans la liste principale de la page.
Y avait-il tromperie ou pas?
Selon les données que nous avons pu recueillir, il n’existe aucune raison de penser que l’utilisation de ces références résultait d’une manipulation malintentionnée de l’information. Nous n’avons repéré aucun modèle suspect, ni dans la chronologie des ajouts ni dans le contexte d’une autre activité menée par les principaux contributeurs.
Toutefois, comme nous l’avons dit, la présence même de médias de désinformation représente une menace pour la réputation de Wikipédia et l’intégrité de son service. En outre, des références anodines à des articles factuels rendent plausible l’utilisation d’un élément de désinformation comme référence, étant donné que le nombre de références existant déjà conférera une certaine crédibilité à la source.
Réduire la vulnérabilité de Wikipédia à la manipulation de l’information et les étapes à venir
La version anglaise de Wikipédia semble avoir adopté un consensus selon lequel les sites de désinformation contrôlés par l’État ne sont pas des sources légitimes, peu importe la factualité de l’article référencé. Pourtant, ces lignes directrices pourraient être encore plus claires, et les listes des sources de désinformations interdites devraient être consolidées. L’on peut se demander si d’autres versions linguistiques suivront le mouvement, mais rien n’empêche qui que ce soit de lancer ce débat, en soulignant l’exemple du Wikipédia anglais comme une bonne pratique.
Il est fort probable que ce problème ne se limite pas à ces quatre sites web. Nous les avons utilisés comme exemples de sources de désinformation officiellement désignées et bien connues à l’encontre desquelles certaines éditions de Wikipédia ont déjà pris des mesures. Ainsi, ils constituent un bon cas d’étude des différentes approches mises en place et personnifient l’aspect communautaire de la modération de Wikipédia.
Alors que la compréhension des menaces fait partie intégrante de notre lutte contre la manipulation de l’information, EUvsDisinfo s’intéressera à un certain nombre de plateformes moins étudiées au cours de l’année afin de combler notre manque de connaissances.