Connaissiez-vous les « bots » de Wikipédia ?

Le mieux est de commencer tout d’abord par demander à Wikipédia :

« Les bots sont des agents automatiques ou semi-automatiques qui interagissent avec Wikipédia comme le fait un utilisateur, mais pour des tâches répétitives et fastidieuses pour un humain. Les bots peuvent être utilisés pour créer des articles. D’autres peuvent être utilisés pour éditer ou même détruire des articles. Certains bots sont spécialisés dans la gestion des liens d’interlangue, la résolution des homonymies, les annulations de certains vandalismes ou encore les opérations sur les catégories. Des bots bien conçus peuvent apporter un bénéfice concret à Wikipédia. Cependant, parce que le système n’a pas été conçu pour supporter des bots, même un bon bot peut avoir des effets secondaires non souhaitables. »

C’est donc de ces satanés bots dont il est question dans la traduction ci-dessous. Bien moins pour glorifier l’intelligence artificielle que pour rendre hommage à ceux bien humains qui les programment dans les coulisses.

Remarque : Les wikipédiens francophones ont quant à eux souvent à faire avec le bot Salebot (Attention, bot méchant ! nous prévient-on sur sa page « Utilisateur »), un article spécialement dédié lui avait été consacré par Camille Gévaudan sur le site Écrans en août 2008.

Kristina Alexanderson - CC by-sa

Meet the ‘bots’ that edit Wikipedia

Daniel Nasaw - 25 juillet 2012 - BBC News
(Traduction : elfabixx, Pwetosaurus, Gatitac, Jose, ProgVal, Kaya, fck)

Rencontrez les « bots » qui éditent Wikipédia

Wikipedia est écrit et maintenu par des dizaines de milliers de volontaires bénévoles dans le monde, qui sont eux-mêmes assistés par des centaines de « bots » — des programmes informatiques autonomes — qui aident à garder l’encyclopédie fonctionnelle.

« Le pénis est l’organe mâle de copulation et de miction chez les mammifères. » dit la page Wikipédia en question.

Cette affirmation est indéniablement vraie, et donc mérite d’être dans Wikipédia, mais elle n’a assurément rien à faire dans l’article du site consacré à la Cour suprême !

C’est un facétieux lecteur anonyme de Wikipédia vivant en Caroline du Sud a proposé cette contribution à l’encyclopédie mondiale en ligne la semaine dernière, et il a suffi de quelques secondes pour que cette erreur soit détectée et supprimée.

Ce vandalisme n’a pas été trouvé par un autre contributeur, mais simplement par un programme d’intelligence artificielle appelé « bot », qui est une aphérèse de « robot ».

Virtuellement invisible

ClueBot NG, car tel est son nom, réside dans un ordinateur à partir duquel il intervient sur la vaste encyclopédie pour détecter et nettoyer le vandalisme, quasiment dès que celui-ci apparaît.

Il fait partie des quelques centaines de bots qui patrouillent sur Wikipedia à tout moment. Son rôle dans la restauration immédiate de l’article sur la Cour suprême illustre comment les bots sont devenus une partie indispensable — même si virtuellement invisible — du projet Wikipédia.

« Wikipedia serait une belle pagaille sans les bots », écrivait dans un courriel un administrateur de Wikipédia, connu sur le site sous le nom de Herfold.

À elle seule, la version anglaise de Wikipedia dépasse les quatre millions d’articles ce mois-ci. Elle contient autour de 2.5 milliards de mots, équivalent à des millions de pages, et est 50 fois plus grosse que l’Encyclopædia Britannica.

Wikipedia est maintenue dans toutes les langues par des dizaines de milliers de contributeurs — dont environ 77 000 font plus de cinq éditions par mois.

Le projet est devenu avec le temps tellement vaste et sa maintenance un tel travail intensif que cela défie les capacités de ses administrateurs et simples contributeurs humains de le maintenir en ordre.

Intervenir contre les vandales

C’est là que les (ro)bots interviennent.

« On s’amuse à penser au jour où les robots se mettront en grève juste pour que tout monde se rende compte de la quantité de travail qu’ils abattent », dit Chris Grant un étudiant de 19 ans à Perth en Australie, qui fait partie du comité de Wikipédia qui supervise les robots.

« Le site demanderait beaucoup plus de travail de notre part et épuiserait davantage les contributeurs ».

Les bots effectuent ainsi de nombreuses tâches éditoriales et administratives qui sont fastidieuses, répétitives et chronophages mais néanmoins vitales.

Ils suppriment le vandalisme et les grossièretés, organisent et cataloguent les entrées, et gèrent les coulisses de l’encyclopédie, ce qui lui permet de fonctionner efficacement et de garder son apparence soignée et uniforme dans le style.

En des termes plus concrets, les bots sont comme des étudiants qui veillent sur les livres, déplacent des piles d’un étage à un autre, corrigent les codes-barres au dos des livres, et effectuent d’autres tâches ingrates, qui permettent aux bibliothécaires qualifiés de se concentrer sur les acquisitions et la politique du lieu.

Les bots peuvent-ils écrire ?

« Wikipédia s’est tellement développée que je ne sais pas comment les gens pourraient bien la gérer si tous les bots s’en allaient » nous dit Brad Jorsch, un programmeur informatique en Caroline du Nord qui gère un bot qui traque les bandeaux rappelant aux rédacteurs d’ajouter des sources aux articles.

Les bots sont présents depuis presque aussi longtemps que Wikipédia elle-même.

Le site a été fondé en 2001 et l’année suivante, un bot appelé Rambot a créé environ 30 000 articles — à un rythme du millier par jour — sur les villes individuelles des États-Unis. Le bot a puisé ses données directement à partir de tabeaux de recensement américain. Et les articles se lisaient bien comme s’ils avaient été écrit par un robot. Ils étaient courts et convenus, et contenaient à peine plus que des séries de statistiques démographiques.

Mais, une fois qu’ils avaient été créés, des rédacteurs humains prenaient le relais et remplissaient les entrées avec des détails historiques, des informations sur la politique locale et les sites touristiques.

En 2008, un autre bot a créé des milliers de courts articles sur des astéroïdes, renseignants quelques lignes de données pour chacun à partir des bases de données de la NASA.

Aujourd’hui, la communauté Wikipédia demeure divisée quant à l’apport des bots aux articles. Certains administrateurs trouvent que de petits articles composés de quelques données n’ont que peu de valeur, d’autres trouvent que tout nouveau contenu est bon à prendre.

La peur des bots malicieux

Le résultat du débat a été que les bots ne sont désormais plus autorisés à écrire des articles entiers. Cependant, leur capacité à effectuer le plus gros de la maintenance libère les vrais contributeurs humains qui disposent alors de plus de temps pour effectuer une recherche, créer ou modifier un article et vérifier l’exactitude du travail des autres.

« Je ne pense pas que les gens réalisent quelle quantité de maintenance et de travail annexe sont nécessaires sur Wikipédia » dit Grant.

Certains administrateurs craignent les dégâts qu’un bot renégat pourrait un jour occasionner à l’encyclopédie. Pensez à Skynet dans les films Terminator.



Ces peurs sont infondées, d’après Grant.

Déjà, un robot n’est pas comme une automobile : si une partie d’une opération échoue, il s’arrêtera plutôt que de se fracasser quelque part.

« Il faudrait déjà que quelqu’un demande à un programmeur de rendre le bot fou et qu’il efface tout », dit Grant.

« Les bots avec les droits de supprimer des pages, bloquer des éditeurs, et prendre d’autres décisions drastiques ne peuvent être utilisés que par des contributeurs de confiance disposant de hauts privilèges administratifs », dit Grant.

Cependant, les bots aussi font des erreurs lorsqu’ils font face à des situations pour lesquelles ils n’ont pas été conçus. ClueBot NG, le bot anti-vandlisme, a cependant un très faible taux de faux positifs (lorsqu’il confond des articles légitimes avec du vandalisme). Étant donné que Wikipédia garde une trace des éditions, les erreurs peuvent être réparées presque aussi vite qu’elles surgissent, disent les administrateurs.

Les contributeurs humains ne craignent pas d’être un jour remplacés par les bots, disent les maîtres de bots. « Ecrire un article, citer ses sources, ou encore améliorer sa grammaire et son orthographe nécessiteront toujours le concours d’une personne », conclut Jorsch.

Crédit photo : Kristina Alexanderson (Creative Commons By-Sa)