PROJET-INFO5 2021 GenderedNews
Jump to navigation
Jump to search
Le projet
Le sujet
Le projet GenderedNews vise à proposer de nouvelles méthodes pour mesurer et expliquer le niveau de biais de genre dans les médias en France.
Les réalisations demandées
Le but du projet était de développer un site web permettant de collecter des données, les traiter et les mettre en valeur, ce qui se découpe de la manière suivante :
- Collecte (ou scraping) d'articles de quotidiens nationaux tels que Le Monde ou Libération
- Traitement linguistique pour évaluer le genre des personnes citées dans les articles (il est déjà réalisé par une chercheuse de l'équipe de l'Université) à intégrer dans le projet
- Stockage des données (métadonnées et données calculées lors du traitement)
- Présentation des données sous forme de graphiques sur un site web
L'équipe
- Antoine SAGET
- Gloria NGUENA
- Mica MURPHY (cheffe de projet)
- Nhat Quang HO
Supervisé par : François PORTET, Gilles BASTIN
Journal
Sprint 0 – Du 28/01 au 29/01
Jeudi 28/01
- Présentation des projets
- Constitution des équipes
Sprint 1 – Du 01/02 au 05/02
Lundi 01/02
- 1ère rencontre avec l'équipe de l'Université à propos de :
- La présentation globale du projet et des membres
- L'organisation de l'équipe
- L'architecture du système (BDD, scraping, traitement linguistique, présentation des données...)
- Les contraintes et lignes à suivre (modularité, maintenance...)
- Le déploiement sur les machines du laboratoire
Mardi 02/02
- Constitution d'un Drive pour l'équipe Polytech
- Début de la phase de recherche individuelle concernant notamment :
- L'architecture
- Les outils
- Les technologies
Vendredi 05/02
- Réalisation d'une première version d'un outil de scraping en Python avec Europresse
Sprint 2 – Du 08/02 au 12/02
Mardi 09/02
- Soutenance finale des projets ECOM
Mercredi 10/02
- Réunion avec l'équipe Polytech pour faire le point sur les recherches individuelles
- Rédaction d'un livrable pour présenter nos premières propositions à l'équipe de l'Université
Jeudi 11/02
- 2ème rencontre avec l'équipe de l'Université
Sprint 3 – Du 22/02 au 26/02
Lundi 22/02
- Bilan de l'avancement de chacun pendant la semaine d'interruption pédagogique
Mardi 23/02
- Séance de travail en présentiel
- Design et création de la base de données
- Préparation de la soutenance de mi-parcours du projet
Mercredi 24/02
- Remplissage de la base de données
- Documentation sur la base de donnée
- Prototypage Metabase, scrapping et flux RSS
Jeudi 26/02
- Réunion hebdomadaire avec les porteurs du projet
Vendredi 26/02
- Soutenance de mi-parcours du projet
Sprint 4 – Du 01/03 au 05/03
Lundi 01/03
- Séance de travail en présentiel
- Première version du poster d'anglais
Mardi 02/03
- Séance de travail en présentiel
- Elaboration du document de design du projet
Mercredi 03/03
- Mise au propre du prototype
- Création des classes python
- Création des fichiers de configurations
- Généralisation des processus
- Recherche de templates pour le site
Jeudi 04/03
- Réunion hebdomadaire avec les porteurs du projet
- Correction du poster d'anglais
- Réunion de début de sprint
Vendredi 05/03
- Réunion avec le DPO Patrick Guillot
- Automatisation de la récupération des articles à l'aide de Cron
Sprint 5 – Du 08/03 au 12/03
Lundi 08/03
- Implémentation de tests et de classes
- Création du site à partir du template Jekyll
Mardi 09/03
- Séance de travail en présentiel
- Structuration du site
Mercredi 10/03
- Recherche de templates pour le site
- Implémentation de tests et de classes
Jeudi 11/03
- Réunion hebdomadaire avec les porteurs du projet
- Démonstration de notre travail
- Séance de travail en présentiel
- Réunion de début de sprint
Vendredi 12/03
- Recherche sur l'internalisation du site
- Déploiement du site sur le serveur
Sprint 6 – Du 15/03 au 19/03
'Lundi 15/03
- Elaboration d'un prototype de bot twitter
- Séance de travail à distance
- Début de la rédaction des slides de présentation
Mardi 16/03
- Séance de travail en présentiel
- Début de la rédaction du rapport
Mercredi 17/03
- Séance de travail en présentiel
Jeudi 18/03
- Réunion hebdomadaire avec les porteurs du projet
- Séance de travail en présentiel
Vendredi 19/03