PAGE WIKI ETUDIANTS 2011-12 SERRURE VOCALE

From air
Revision as of 18:55, 3 March 2012 by Elbakkon (talk | contribs)
Jump to: navigation, search

Membres du groupe

  1. NAHUM Solis
  2. EL BAKKOURI Nysrine
  3. MALKAS Benjamin
  4. RIOT Emilien
  5. SEISSON Julien
  6. ODUL Jonathan

Présentation du projet

Le but de ce projet est de développer un système de reconnaissance vocale. Nous devons réaliser un programme permettant d'ouvrir une gâche électronique simplement par la parole. Les voix des locuteurs seront préalablement enregistrées, et devront être identifiées par un système de reconnaissance vocale afin de permettre ou non l'ouverture de la gâche électronique.

Déroulement du travail

Etude de l'existant

Ce projet a déjà été réalisé l'année précédente, pour cela, nous avons commencé par analyser l'existant, afin de garder les parties fonctionnelles et les améliorer.Puisqu'on a une bonne partie du projet qui a déjà été réalisée, nous avons penser à faire une étude de robustesse de notre projet afin de bien l'évaluer.

Après analyse du projet, nous avons réparti les différentes parties sur les différents membres du groupe. Nous avons démarré les trois parties en parallèle: Montage, acquisition et IHM afin de gagner un maximum de temps. Une fois ces parties finies, on s'est tous penché sur l'interfaçage entre l'IHM et les script de reconnaissance ainsi que les tests de performances.


Répartition des tâches

Chef de projet:

  1. NAHUM Solis

Développeurs Acquisition/ Reconnaissance:

  1. MALKAS Benjamin
  2. NAHUM Solis
  3. EL BAKKOURI Nysrine

Montage gâche:

  1. ODUL Jonathan

Développement IHM:

  1. ODUL Jonathan
  2. RIOT Emilien
  3. SEISSON Julien

Responsable wiki:

  1. EL BAKKOURI Nysrine

Explication des différentes parties

Montage électrique de la gâche

Cette partie consiste à réaliser un simple montage électrique qui nous permettra de tester notre système à la fin du projet.

Acquisition et Reconnaissance des données

Nous avons d'abord commencé par mette en place l'environnement de travail, pour cela, nous avons fait le TP: http://www-clips.imag.fr/geod/User/laurent.besacier/NEW-TPs/TP-Biometrie/ Analyse, Mise en place d’algorithmes de reconnaissance du locuteur : Pour la réalisation de cette phase, les travaux se sont appuyés sur le TP Biométrie préparatoire à ce projet. Les signaux de départ correspondent aux voix des 12 membres du groupe enregistrées au format raw comme dans le TP. Les vecteurs paramètres de ces voix ont ensuite été générés grâce à l’outil spro, puis le modèle du monde créé en suivant les étapes décrites dans le TP préparatoire. Les modèles de locuteurs correspondant à ces 12 voix qui seront reconnues par le système ont également été créés.

L’an dernier, en plus de l’acquisition des signaux de 12 membres du groupe, deux scripts  ont été également faits pour  l’acquisition du signal d’un nouveau locuteur et la reconnaissance d’un locuteur quelconque par le système.

Le script d’acquisition de signaux permet donc d’enregistrer le signal d’un nouveau locuteur, de créer le vecteur de paramètre, de traiter le signal (normaliser, détecter l’énergie, renormaliser) et de l’ajouter au modèle du monde. Lors de l’acquisition le locuteur peut choisir d’être reconnu par le système ou non. S’il souhaite être reconnu alors son modèle de locuteur est généré. Une méthode java permettant d'exécuter un script shell a été réalisée mais nous ne disposons pas de cette méthode dans la documentation fournie. Le script de reconnaissance du locuteur permet de tester l’appartenance d’un locuteur au système. Il enregistre le signal du locuteur pendant quelques secondes, crée le vecteur de paramètres, traite le signal (normalisation, détection de l'énergie, re-normalisation) puis teste, en fonction de son nom, si ce locuteur est reconnu par le système ou non. CE QUE NOUS REUTILISONS DANS NOTRE PROJET : Vu que cette partie du projet a été bien réussie, nous réutiliserons, les 2 scripts fournis. Pour ne pas avoir à chercher en permanence des personnes extérieures à notre système pour les tests, nous utiliserons les membres de notre groupe de 6 : 4 locuteurs reconnus par le système et 2 imposteurs.



IHM de pilotage de la gâche

Test des performances et robustesse de notre système