PROJET-INFO5 2021 GenderedNews

= Le projet =

Le sujet
Le projet GenderedNews vise à proposer de nouvelles méthodes pour mesurer et expliquer le niveau de biais de genre dans les médias en France.

Les réalisations demandées
Le but du projet était de développer un site web permettant de collecter des données, les traiter et les mettre en valeur, ce qui se découpe de la manière suivante :


 * Collecte (ou scraping) d'articles de quotidiens nationaux tels que Le Monde ou Libération
 * Traitement linguistique pour évaluer le genre des personnes citées dans les articles (il est déjà réalisé par une chercheuse de l'équipe de l'Université) à intégrer dans le projet
 * Stockage des données (métadonnées et données calculées lors du traitement)
 * Présentation des données sous forme de graphiques sur un site web

= L'équipe =


 * Antoine SAGET
 * Gloria NGUENA
 * Mica MURPHY (cheffe de projet)
 * Nhat Quang HO

Supervisé par : François PORTET, Gilles BASTIN

= Journal =

Sprint 0 – Du 28/01 au 29/01
Jeudi 28/01


 * Présentation des projets
 * Constitution des équipes

Sprint 1 – Du 01/02 au 05/02
Lundi 01/02


 * 1ère rencontre avec l'équipe de l'Université à propos de :
 * La présentation globale du projet et des membres
 * L'organisation de l'équipe
 * L'architecture du système (BDD, scraping, traitement linguistique, présentation des données...)
 * Les contraintes et lignes à suivre (modularité, maintenance...)
 * Le déploiement sur les machines du laboratoire

Mardi 02/02


 * Constitution d'un Drive pour l'équipe Polytech
 * Début de la phase de recherche individuelle concernant notamment :
 * L'architecture
 * Les outils
 * Les technologies

Vendredi 05/02


 * Réalisation d'une première version d'un outil de scraping en Python avec Europresse

Sprint 2 – Du 08/02 au 12/02
Mardi 09/02


 * Soutenance finale des projets ECOM

Mercredi 10/02


 * Réunion avec l'équipe Polytech pour faire le point sur les recherches individuelles
 * Rédaction d'un livrable pour présenter nos premières propositions à l'équipe de l'Université

Jeudi 11/02


 * 2ème rencontre avec l'équipe de l'Université

Sprint 3 – Du 22/02 au 26/02
Lundi 22/02


 * Bilan de l'avancement de chacun pendant la semaine d'interruption pédagogique

Mardi 23/02


 * Séance de travail en présentiel
 * Design et création de la base de données
 * Préparation de la soutenance de mi-parcours du projet

Mercredi 24/02


 * Remplissage de la base de données
 * Documentation sur la base de donnée
 * Prototypage Metabase, scrapping et flux RSS

Jeudi 26/02


 *  Réunion hebdomadaire avec les porteurs du projet

Vendredi 26/02


 * Soutenance de mi-parcours du projet

Sprint 4 – Du 01/03 au 05/03
Lundi 01/03


 * Séance de travail en présentiel
 * Première version du poster d'anglais

Mardi 02/03


 * Séance de travail en présentiel
 * Elaboration du document de design du projet

Mercredi 03/03


 * Mise au propre du prototype
 * Création des classes python
 * Création des fichiers de configurations
 * Généralisation des processus
 * Recherche de templates pour le site

Jeudi 04/03


 *  Réunion hebdomadaire avec les porteurs du projet
 *  Correction du poster d'anglais
 * Réunion de début de sprint

Vendredi 05/03


 * Réunion avec le DPO Patrick Guillot
 * Automatisation de la récupération des articles à l'aide de Cron

Sprint 5 – Du 08/03 au 12/03
Lundi 08/03


 * Implémentation de tests et de classes
 * Création du site à partir du template Jekyll

Mardi 09/03


 * Séance de travail en présentiel
 * Structuration du site

Mercredi 10/03
 * Recherche de templates pour le site
 * Implémentation de tests et de classes

Jeudi 11/03


 *  Réunion hebdomadaire avec les porteurs du projet
 * Démonstration de notre travail
 * Séance de travail en présentiel
 * Réunion de début de sprint

Vendredi 12/03


 * Recherche sur l'internalisation du site
 * Déploiement du site sur le serveur

Sprint 6 – Du 15/03 au 19/03
'Lundi 15/03


 * Elaboration d'un prototype de bot twitter
 * Séance de travail à distance
 * Début de la rédaction des slides de présentation

Mardi 16/03


 * Séance de travail en présentiel
 * Début de la rédaction du rapport

Mercredi 17/03
 * Séance de travail en présentiel

Jeudi 18/03


 *  Réunion hebdomadaire avec les porteurs du projet
 * Séance de travail en présentiel

Vendredi 19/03



= Liens =


 * Présentation du projet
 * Gitlab