GenderedNews

= projet de serveur web GenderedNews =

Encadrant : François Portet, Gilles Bastin

Le projet GenderedNews
Le projet GenderedNews vise à proposer de nouvelles méthodes pour mesurer et expliquer le niveau de biais de genre dans les médias en France. Ces biais peuvent être définis comme le fait que les médias d'information tendent d'une part à sur-représenter les hommes par rapport aux femmes en termes de mentions et de citations, et d'autre part à attribuer aux femmes un rôle social spécifique impliquant souvent, entre autres, l'anonymat, une capacité d'action réduite dans la société et la confusion entre cette action et leur état matrimonial ou familial. De nombreuses études empiriques ont prouvé l'existence de ces biais et ont permis de mieux les comprendre à l'échelle internationale.

Cependant, la recherche sur cette question est souvent basée sur des données limitées en volume et produites par des ONG, des administrations ou des organismes de réglementation des médias. Ces données sont généralement traitées par des analyses de contenu manuelles qui ne permettent pas de rendre compte systématiquement des évolutions des biais sexistes dans les médias à long terme et sur un grand nombre de sources, ni d'expliquer ces biais en termes de variables telles que le financement des médias, la taille des salles de rédaction ou d'autres variables organisationnelles.

GenderedNews se concentre sur deux types de biais et deux mesures différentes de ces biais. Les biais d'échantillonnage se produisent par la sélection d'un échantillon biaisé de personnes mentionnées dans les médias. Ils peuvent être étudiés en comptant simplement combien d'hommes et de femmes ont accès à la visibilité publique d'un côté et en étudiant les modèles de cadrage des hommes et des femmes représentés de l'autre côté. Les biais de citation proviennent de la sélection d'un échantillon biaisé de personnes qui, en plus d'être visibles, sont autorisées à exprimer leurs opinions dans les médias. Ils peuvent également être étudiés en utilisant les deux approches: compter combien d'un      côté et analyser comment de l'autre.

Le projet GenderedNews vise à fournir et à analyser des sources de données importantes et stables dans le temps ainsi qu'à explorer de nouvelles méthodes pour documenter les préjugés sexistes dans les médias. Il est basé sur un programme de recherche collaboratif entre un sociologue des médias et un informaticien ayant des compétences en études des médias, études de genre, traitement du langage naturel et collecte de données numériques. Il a également une dimension de partenariat importante dans la mesure où plusieurs médias importants sont associés et fournissent un accès à leurs données.

Le projet
Développer un site web permettant de collecter des données, les traiter et les mettre en valeur

Plusieurs initiatives proches de notre projet ont conduit à la mise en place de tableaux de bord de la parité des contenus médiatiques. On peut citer le Gender Gap Tracker canadien (https://gendergaptracker.informedopinions.org/), le projet de baromètre de la parité du Temps (https://labs.letemps.ch/interactive/2019/barometre-parite/), le JanetBot du Financial Times (https://labs.ft.com/product/2018/11/07/janetbot.html).

Nous souhaitons proposer à un groupe d’étudiant•es de contribuer à GenderedNews en développant une architecture logicielle capable de collecter des données sur les sites des medias (contenus des articles, images éventuellement), de les analyser en utilisant la méthodologie mise en place dans le projet GenderedNews et de les visualiser sur un site web dédié.

Dans le cadre du projet, les étudiants pourront travailler sur les tâches suivantes :

- collecte des données : développement d’outils de scraping utilisés sur les sites de médias pour collecter le texte des articles publiés - des techniques de traitement automatique du langage naturel : calculs de quelques indicateurs quotidiens sur ces données - les technologies web (site web, base de données) pour le stockage d'indicateur et la visualisations des données - positionnement du traitement de données par rapport à la législation - la gestion de projet - autres : interaction sur les réseaux sociaux, etc.