EA2013 Vandalisme dans les Wiki

From air
Jump to navigation Jump to search

Présentation

Abstract

As numbers of contributors has increased exponientially in Wikipedia, the encyclopedia is highly enriched. However, it has also brought a lot of both incorrect and vandalism content. This article emphasizes the need to use anti-vandal tools implemented by the Wikipedian community for itself, so members can control the numerous changes that are made.

Keywords

Wikipedia, vandalism, anti-vandal tools, bot, cyborg

Résumé

Avec l'augmentation exponentielle du nombre de contributeurs sur Wikipédia, l'encyclopédie s'est fortement enrichie. Cependant, cela a amené aussi beaucoup de contenu erroné ainsi que des actes de vandalisme. Cet article insiste sur la nécessité d'utiliser des outils d'antivandalisme, mis en place par la communauté wikipédienne pour elle même, de telle sorte à pouvoir contrôler les nombreuses modifications effectuée.

Mots-clés

Wikipédia, vandalisme, outils d'antivandalisme, robot (bot), cyborg

Synthèse

Contexte

Evolution du nombre de contributeurs actifs sur Wikipedia
Evolution du nombre de contributeurs actifs sur Wikipédia de 2001 à 2010

Le projet Wikipédia a été lancé le 15 janvier 2001 dans le but de mettre à disposition de tous une encyclopédie libre et éditable par chacun. Au lancement du projet, seul un nombre restreint de personnes contribue, compris entre 10 et 100. Dès 2004, Wikipédia connaît un engouement pour son encyclopédie. Ainsi, le nombre de contributeurs et d'éditions d'article commence à augmenter de manière exponentielle. En 2006, l'augmentation est la plus rapide. A ce stade, Wikipédia met déjà à disposition des outils permettant aux contributeurs de s'assurer de la cohérence des nombreux articles mis en lignes. Cette coissance exceptionnelle continua jusqu'en 2007, date à laquelle l'encyclopédie a déjà été massivement remplie. A partir de ce moment, le nombre de contributeurs diminue progressivement mais reste cependant très important.

Le vandalisme

Wikipédia est une encyclopédie en ligne permettant à n'importe quel internaute d'éditer un article sans même avoir à s'identifier. Ainsi, il est facile d'ajouter de l'information qui peut être erronée, non conforme aux conditions d'utilisation ou issue d'actes de vandalisme. La liste ci-dessous indique quelques cas à identifier par la communauté wikipédienne :

  • Violations de copyright
  • Articles diffamatoires
  • Orthographe
  • Vandalisme
    • Suppression de contenu
    • Ajout de contenu erroné
    • Faux rollback

Les types d'outils d'antivandalisme

La communauté wikipédienne doit être en mesure de contrôler la véracité et l'intégrité des articles mis en ligne. Or, contenu de la quantité importante de contributions et d'éditions d'articles, les contrôles ne peuvent être intégralement effectués par de seuls humain. En effet, les annulations de contenu doivent être effectuées très rapidement avant que le contenu erroné ne soit visulalisé par des internautes et qu'il soit mis en cache par les moteurs de recherche.

Faux contenu Wikipédia indexé par un moteur de recherche.
Faux contenu Wikipédia indexé par un moteur de recherche.

Pour luter plus efficassement contre le vandalisme, des programmes de deux types sont utilisés.

Les robots (bots)

Répartition des annulations entre acteurs de l'antivandalisme
Répartition des annulations entre acteurs de l'antivandalisme

Les robots sont apparus comme étant une première manière d'éliminer une grande quantité des moditifations issues du vandalisme basique. En effet, ils sont autonomes et permettent aux humains de se focaliser sur le vandalisme plus difficile à détecter. Un article référence les bots utilisés par l'encyclopédie en ligne et les classe selon le nombre d'éditions effectuées : List_of_bots_by_number_of_edits.

AntiVandalBot

AntiVandalBot fait parti de la première génération de robot ayant pour vocation de lutter contre le vandalisme. Celui est basé sur de simples règles utilisant des listes noires et des partons. Ainsi, lorsqu'un test est effectué sur une édition d'article, si le résultat de celui-ci est vrai alors le robot annule la modification et restaure la version précédente. De cette manière, le robot peut lutter contre le vandalisme le plus évident et éliminer automatiquement une part d'éditions non souhaitées.

ClueBot_NG

ClueBot_NG est un robot de nouvelle génération succedant à AntiVandalBot. Celui-ci apporte certaines améliorations par rapport à son précésseur, notamment :

  • La détection de 40% du vandalisme total avec un taux de faux positifs réduit à 0,1%;
  • Basé sur l'autoapprentissage de règles : il examine une liste d'éditions (appelée "corpus" or "dataset") pré-classées en légitime ou vandal pour construire ses règles.

Les cyborgs

Puisque les robots de sont pas capable de détecter le vandalisme poussé, l'humain doit être solicité. Etant donné le nombre important d'actes de vandalisme restant malgré la première barrière mise en place par les robots, la communauté wikipédienne ne peut pas gérer cela sans outils. Ainsi, des programmes appelés "cyborgs" viennent en complément des robots. Ils permettent de fournir des indications à l'utilisateurs pour identifier plus facilement les contributions les plus succeptibles d'être des actes de vandalisme. L'utilisateur peut alors au sein de l'application déclancher une action comme signaler la contribution comme étant un acte de vandalisme, donner un avertissement au contributeur et supprimer la modification.

VandalProof

VandalProof est un des premiers cyborgs mis à disposition pas la communauté wikipédienne pour le projet anglophone, permettant de simplifier les actions de recherche contributions récentes et potentiellements frauduleuses puis de les révauquer. Les fonctionnalité principales sont citées ci-dessous :

  • Surveiller les modifications récentes (Recent Changes)
  • Visualisation des contributions d'un utilisateur
  • Actions en un clic
    • Révoquer une édition
    • Poster un message d'avertissement
    • Insérer le contributeur dans la liste noire
    • Mettre à jour le journal de vandalisme
Huggle

Huggle est le successeur de VandalProof le plus connu. Il apporte des améliorations, notamment au niveau de l'interface avec une IHM conviviale et efficasse.

Répartition des suppressions par acteur

Démonstration

Robot

  • Détection "salut" comme "bonjour" et message émis par le robot en langage naturel

Cyborg

  • Démonstration de Huggle avec capture Huggle (pour SALUT ! avant suppression bot) + cache Google

Annexes

Liens