Difference between revisions of "PROJET-INFO5 2021 GenderedNews"

From air
Jump to navigation Jump to search
Line 130: Line 130:
 
''Lundi 08/03''
 
''Lundi 08/03''
   
  +
* Implémentation de tests et de classes
* Séance de travail en présentiel
 
  +
* Création du site à partir du template Jekyll
* Première version du poster d'anglais
 
   
 
''Mardi 09/03''
 
''Mardi 09/03''
   
 
* Séance de travail en présentiel
 
* Séance de travail en présentiel
  +
* Structureation du site
* Elaboration du document de design du projet
 
   
 
''Mercredi 10/03''
 
''Mercredi 10/03''
  +
 
 
* Recherche de templates pour le site
* Mise au propre du prototype
 
** Création des classes python
+
* Implémentation de tests et de classes
**Création des fichiers de configurations
 
**Généralisation des processus
 
* Recherche de templates pour le site
 
   
 
''Jeudi 11/03''
 
''Jeudi 11/03''
   
 
* '' Réunion hebdomadaire avec les porteurs du projet''
 
* '' Réunion hebdomadaire avec les porteurs du projet''
  +
** Démonstration de notre travail
* '' Correction du poster d'anglais''
 
 
* Séance de travail en présentiel
 
* Réunion de début de sprint
 
* Réunion de début de sprint
   
 
''Vendredi 12/03''
 
''Vendredi 12/03''
   
  +
* Recherche sur l'internalisation du site
* ''Réunion avec le DPO Patrick Guillot''
 
  +
* Déploiement du site sur le serveur
* Automatisation de la récupération des articles à l'aide de Cron
 
   
 
== Sprint 6 – Du 15/03 au 19/03 ==
 
== Sprint 6 – Du 15/03 au 19/03 ==

Revision as of 10:38, 17 March 2021

Le projet

Le sujet

Le projet GenderedNews vise à proposer de nouvelles méthodes pour mesurer et expliquer le niveau de biais de genre dans les médias en France.

Les réalisations demandées

Le but du projet était de développer un site web permettant de collecter des données, les traiter et les mettre en valeur, ce qui se découpe de la manière suivante :

  • Collecte (ou scraping) d'articles de quotidiens nationaux tels que Le Monde ou Libération
  • Traitement linguistique pour évaluer le genre des personnes citées dans les articles (il est déjà réalisé par une chercheuse de l'équipe de l'Université) à intégrer dans le projet
  • Stockage des données (métadonnées et données calculées lors du traitement)
  • Présentation des données sous forme de graphiques sur un site web

L'équipe

  • Antoine SAGET
  • Gloria NGUENA
  • Mica MURPHY (cheffe de projet)
  • Nhat Quang HO

Supervisé par : François PORTET, Gilles BASTIN

Journal

Sprint 0 – Du 28/01 au 29/01

Jeudi 28/01

  • Présentation des projets
  • Constitution des équipes

Sprint 1 – Du 01/02 au 05/02

Lundi 01/02

  • 1ère rencontre avec l'équipe de l'Université à propos de :
    • La présentation globale du projet et des membres
    • L'organisation de l'équipe
    • L'architecture du système (BDD, scraping, traitement linguistique, présentation des données...)
    • Les contraintes et lignes à suivre (modularité, maintenance...)
    • Le déploiement sur les machines du laboratoire

Mardi 02/02

  • Constitution d'un Drive pour l'équipe Polytech
  • Début de la phase de recherche individuelle concernant notamment :
    • L'architecture
    • Les outils
    • Les technologies

Vendredi 05/02

  • Réalisation d'une première version d'un outil de scraping en Python avec Europresse

Sprint 2 – Du 08/02 au 12/02

Mardi 09/02

  • Soutenance finale des projets ECOM

Mercredi 10/02

  • Réunion avec l'équipe Polytech pour faire le point sur les recherches individuelles
  • Rédaction d'un livrable pour présenter nos premières propositions à l'équipe de l'Université

Jeudi 11/02

  • 2ème rencontre avec l'équipe de l'Université

Sprint 3 – Du 22/02 au 26/02

Lundi 22/02

  • Bilan de l'avancement de chacun pendant la semaine d'interruption pédagogique

Mardi 23/02

  • Séance de travail en présentiel
  • Design et création de la base de données
  • Préparation de la soutenance de mi-parcours du projet

Mercredi 24/02

  • Remplissage de la base de données
  • Documentation sur la base de donnée
  • Prototypage Metabase, scrapping et flux RSS

Jeudi 26/02

  • Réunion hebdomadaire avec les porteurs du projet

Vendredi 26/02

  • Soutenance de mi-parcours du projet

Sprint 4 – Du 01/03 au 05/03

Lundi 01/03

  • Séance de travail en présentiel
  • Première version du poster d'anglais

Mardi 02/03

  • Séance de travail en présentiel
  • Elaboration du document de design du projet

Mercredi 03/03

  • Mise au propre du prototype
    • Création des classes python
    • Création des fichiers de configurations
    • Généralisation des processus
  • Recherche de templates pour le site

Jeudi 04/03

  • Réunion hebdomadaire avec les porteurs du projet
  • Correction du poster d'anglais
  • Réunion de début de sprint

Vendredi 05/03

  • Réunion avec le DPO Patrick Guillot
  • Automatisation de la récupération des articles à l'aide de Cron

Sprint 5 – Du 08/03 au 12/03

Lundi 08/03

  • Implémentation de tests et de classes
  • Création du site à partir du template Jekyll

Mardi 09/03

  • Séance de travail en présentiel
  • Structureation du site

Mercredi 10/03

  • Recherche de templates pour le site
  • Implémentation de tests et de classes

Jeudi 11/03

  • Réunion hebdomadaire avec les porteurs du projet
    • Démonstration de notre travail
  • Séance de travail en présentiel
  • Réunion de début de sprint

Vendredi 12/03

  • Recherche sur l'internalisation du site
  • Déploiement du site sur le serveur

Sprint 6 – Du 15/03 au 19/03

Vendredi 19/03

  • Soutenance finale du projet

Liens