Difference between revisions of "PAGE WIKI ETUDIANTS 2010-11 SERRURE VOCALE"

From air
Jump to navigation Jump to search
Line 63: Line 63:
 
#:* Première étape, générer les vecteurs de paramètres pour chacun des signaux.
 
#:* Première étape, générer les vecteurs de paramètres pour chacun des signaux.
 
#:Pour cela, nous utilisons un outil fourni dans le TP : spro ([http://www.irisa.fr/metiss/guig/spro/download.html]) qui propose une commande ''sfbcep -F PCM16 -f16000 -p 19 -e -D -A locuteur.raw locuteur.prm'' qui va créer un vecteur de paramètres pour le fichier locuteur.raw. Comme nous avons 12 signaux, donc 12 vecteurs à générer, nous allons créer un script csh. Pour cela, nous plaçons tout d'abord dans un fichier all.lst la liste des noms des signaux (noms des locuteurs). Et nous écrivons notre script :
 
#:Pour cela, nous utilisons un outil fourni dans le TP : spro ([http://www.irisa.fr/metiss/guig/spro/download.html]) qui propose une commande ''sfbcep -F PCM16 -f16000 -p 19 -e -D -A locuteur.raw locuteur.prm'' qui va créer un vecteur de paramètres pour le fichier locuteur.raw. Comme nous avons 12 signaux, donc 12 vecteurs à générer, nous allons créer un script csh. Pour cela, nous plaçons tout d'abord dans un fichier all.lst la liste des noms des signaux (noms des locuteurs). Et nous écrivons notre script :
##:foreach i (`cat all.lst`)
+
#::foreach i (`cat all.lst`)
##:sfbcep -F PCM16 -f16000 -p 19 -e -D -A $i.raw $i.prm
+
#::sfbcep -F PCM16 -f16000 -p 19 -e -D -A $i.raw $i.prm
##:end
+
#::end
   
   

Revision as of 10:49, 3 March 2011

Composition du groupe gache électrique // serrure vocale :

Chefs de projet :

  1. Florian FAUVARQUE
  2. Marc VOLAINE

Membres du groupe "IHM" :

  1. Frédéric DUPIN
  2. Jonathan HARTNAGEL
  3. Cédric MERIADEC
  4. Clément RIGNAULT

Membres du groupe "ELECTRIQUE" :

  1. Frédéric COUDURIER
  2. Anthony DAMOTTE

Membres du groupe "ALGORITHMIQUE" :

  1. Maxime CONQ
  2. Raphaëlle DIDIER
  3. Floriane PIHUIT

Gâche électronique:

Cette partie a pour but d'expliquer et d'illustrer le fonctionnement de la gâche électronique. Des comptes-rendus et documentations supplémentaires sont disponibles en annexe.

Gache électrique pour biométrie
  1. La gâche électrique:
    La gâche électrique provient d'un projet réalisé par les étudiants RICM5 promotion 2010 intitulé : TouchKey.
    • Gache électrique réversible gauche ou droite.
    • Dimension du corps: 160x25x30 en aluminium inoxidable donc garde le même aspect trés longtemps
    • Fonctionne en 10VDC avec une tolérance importante de 20% soit entre 8 volts et 12 volts permettant toujours d'être très adaptable a de nombreuses installations.
    • Température de fonctionnement: de - 15 degrée centigrade à + 50 degrée centigrade
  2. Le circuit électronique:
    Le circuit électronique provient également du projet TouchKey.
    • Contenu : 2 résistances (820 et 220 Ohms), un transistor NPN et l'adaptateur alimentation.
    • Schéma : Schéma électronique
    • Alimentation : est fourni avec le circuit un transformateur courant alternatif 220 - continu 9V.
  3. La conversion numérique/analogique (CAN)
    • Technologies utilisées : JAVA, USB, Port série
    • Sources du code :


Gachette electrique - Cahier des charges / Schéma du montage

Analyse de la parole:

Le but du projet est de permettre à certains locuteurs préalablement enregistrés dans le système d'ouvrir une porte simplement par la parole. C'est ici qu'entre en jeu la phase d'analyse. Avant de commencer le projet, nous avons étudié les TPs de biométrie de l'année dernière ([1]) ainsi que plusieurs compte-rendus de précédents étudiants que l'on nous a fournis. Cela nous fournit ainsi toutes les étapes ainsi que la marche à suivre en ce qui concerne la reconnaissance de locuteurs. Enfin, nous avons vu dans les comptes rendus de TPs que les résultats sont meilleurs lorsque l'on normalise et que l'on détecte l'énergie des signaux, nous ferons de même pour notre projet.

Voici les différentes étapes de la reconnaissance d'un locuteur :

  1. Tout d'abord, nous récupérons un ensemble de voix qui nous servira à créer un modèle du monde. Nous avons utilisé les voix des membres du projet (ce qui nous donne 12 voix : 9 d'hommes et 3 de femmes). Pour cela, nous utilisons un logiciel en ligne de commande sous linux qui se nomme bplay ([2]), et la commande pour enregistrer une voix : brec -r -b 16 -s 16000 -t 60 locuteur.raw : "-b 16" pour préciser le nombre de bits, "-s 16000" pour préciser la fréquence (16kHz) et "-t 60" pour enregistrer 60 secondes de signal. A remarquer également que le fichier enregistré a une extension en .raw ; nous avons choisi cela car c'est le même format que pour les TPs. Nous pouvons également écouter le signal enregistré avec la commande : bplay -b 16 -s 16000 locuteur.raw
  2. Maintenant que nous avons enregistré ces 12 voix (extension .raw), nous allons traiter ces signaux.
    • Première étape, générer les vecteurs de paramètres pour chacun des signaux.
    Pour cela, nous utilisons un outil fourni dans le TP : spro ([3]) qui propose une commande sfbcep -F PCM16 -f16000 -p 19 -e -D -A locuteur.raw locuteur.prm qui va créer un vecteur de paramètres pour le fichier locuteur.raw. Comme nous avons 12 signaux, donc 12 vecteurs à générer, nous allons créer un script csh. Pour cela, nous plaçons tout d'abord dans un fichier all.lst la liste des noms des signaux (noms des locuteurs). Et nous écrivons notre script :
    foreach i (`cat all.lst`)
    sfbcep -F PCM16 -f16000 -p 19 -e -D -A $i.raw $i.prm
    end




Cette partie a pour but d'expliquer l'algorithme de reconnaissance de la parole. Nous allons résumer le tp de biométrie [4] Des compte-rendus sont disponibles en annexe.

  1. Reconnaissance des genres:
    Suite à l’analyse des TPs disponibles nous pouvons déclarer que pour une bonne reconnaissance de genre (la parole est de type male ou femelle) il faut :
    • Normaliser les paramètres
    • Détecter l’énergie
    Nous gardons ces caractéristiques pour l'élaboration du projet.
  2. Reconnaissance du locuteur:
    Pour cette partie, nous disposons de 3 femmes et 9 hommes. Nous procédons de la manière suivante:
    • Récupération des voix
    • Création du modèle monde
    • Création du modèle d'une personne
    1. Récupération des voix
      On utilise l'application B-Play(lien à rajouter) sous Linux. On enregistre chaque locuteur lisant le même texte d'une durée d'une minute dans un fichier.
      Commande d'enregistrement : commande
    2. Création du modèle monde
      On utilise les voix enregistrées pour créer le modèle monde.
      Commande création modèle monde : commande
    3. Création du modèle d'une personne
      Pour créer le modèle d'une personne en particulier, nous combinons (phase d'adaptation) la voix au modèle monde pour extraire le modèle de la personne.
      Commande apprentissage : commande

Interface Graphique

Consultez la page dédiée ci dessous

Interface graphique du client - Cahier des charges / Esquisses de l'IHM