EA2013 Vandalisme dans les Wiki

Présentation

 * Enseignants : Georges-Pierre Bonneau, Didier Donsez (EA2013)
 * Auteur : Jordan Calvi 
 * Télécharger : [[Media:EA_2013_Vandalisme_dans_les_Wiki_Jordan_CALVI.pdf]]

Abstract
As numbers of contributors has increased exponientially in Wikipedia, the encyclopedia is highly enriched. However, it has also brought a lot of both incorrect and vandalism content. This article emphasizes the need to use anti-vandal tools implemented by the Wikipedian community for itself, so members can control the numerous changes that are made.

Keywords
Wikipedia, vandalism, anti-vandal tools, bot, cyborg

Résumé
Avec l'augmentation exponentielle du nombre de contributeurs sur Wikipédia, l'encyclopédie s'est fortement enrichie. Cependant, cela a amené aussi beaucoup de contenu erroné ainsi que des actes de vandalisme. Cet article insiste sur la nécessité d'utiliser des outils d'antivandalisme, mis en place par la communauté wikipédienne pour elle même, de telle sorte à pouvoir contrôler les nombreuses modifications effectuée.

Mots-clés
Wikipédia, vandalisme, outils d'antivandalisme, robot (bot), cyborg

Contexte


Le projet Wikipédia a été lancé le 15 janvier 2001 dans le but de mettre à disposition de tous une encyclopédie libre et éditable par chacun. Au lancement du projet, seul un nombre restreint de personnes contribue, compris entre 10 et 100. Dès 2004, Wikipédia connaît un engouement pour son encyclopédie. Ainsi, le nombre de contributeurs et d'éditions d'article commence à augmenter de manière exponentielle. En 2006, l'augmentation est la plus rapide. A ce stade, Wikipédia met déjà à disposition des outils permettant aux contributeurs de s'assurer de la cohérence des nombreux articles mis en lignes. Cette coissance exceptionnelle continua jusqu'en 2007, date à laquelle l'encyclopédie a déjà été massivement remplie. A partir de ce moment, le nombre de contributeurs diminue progressivement mais reste cependant très important.

Le vandalisme
Wikipédia est une encyclopédie en ligne permettant à n'importe quel internaute d'éditer un article sans même avoir à s'identifier. Ainsi, il est facile d'ajouter de l'information qui peut être erronée, non conforme aux conditions d'utilisation ou issue d'actes de vandalisme. La liste ci-dessous indique quelques cas à identifier par la communauté wikipédienne :


 * Violations de copyright
 * Articles diffamatoires
 * Orthographe
 * Vandalisme
 * Suppression de contenu
 * Ajout de contenu erroné
 * Faux rollback

Les types d'outils d'antivandalisme
La communauté wikipédienne doit être en mesure de contrôler la véracité et l'intégrité des articles mis en ligne. Or, contenu de la quantité importante de contributions et d'éditions d'articles, les contrôles ne peuvent être intégralement effectués par de seuls humain. En effet, les annulations de contenu doivent être effectuées très rapidement avant que le contenu erroné ne soit visulalisé par des internautes et qu'il soit mis en cache par les moteurs de recherche.



Pour luter plus efficassement contre le vandalisme, des programmes de deux types sont utilisés.

Les robots (bots)


Roles; Les robots sont apparus comme étant une première manière d'éliminer une grande quantité des moditifations issues du vandalisme basique. En effet, ils sont autonomes et permettent aux humains de se focaliser sur le vandalisme plus difficile à détecter. Un article référence les bots utilisés par l'encyclopédie en ligne et les classe selon le nombre d'éditions effectuées : List_of_bots_by_number_of_edits.

AntiVandalBot
AntiVandalBot fait parti de la première génération de robot ayant pour vocation de lutter contre le vandalisme. Celui est basé sur de simples règles utilisant des listes noires et des partons. Ainsi, lorsqu'un test est effectué sur une édition d'article, si le résultat de celui-ci est vrai alors le robot annule la modification et restaure la version précédente. De cette manière, le robot peut lutter contre le vandalisme le plus évident et éliminer automatiquement une part d'éditions non souhaitées.

ClueBot_NG
ClueBot_NG est un robot de nouvelle génération succedant à AntiVandalBot. Celui-ci apporte certaines améliorations par rapport à son précésseur, notamment :
 * La détection de 40% du vandalisme total avec un taux de faux positifs réduit à 0,1%;
 * Basé sur l'autoapprentissage de règles : il examine une liste d'éditions (appelée "corpus" or "dataset") pré-classées en légitime ou vandal pour construire ses règles.

Robot

 * Détection "salut" comme "bonjour" et message émis par le robot en langage naturel

Cyborg

 * Démonstration de Huggle avec capture Huggle (pour SALUT ! avant suppression bot) + cache Google

Liens

 * Bots and Cyborgs: Wikipedia's Immune System