Difference between revisions of "PAGE WIKI ETUDIANTS 2011-12 SIGNATURES"

From air
Jump to navigation Jump to search
Line 171: Line 171:
   
 
===Dynamic Time Warping===
 
===Dynamic Time Warping===
  +
Les données des signatures sont convertie en graphe temporelle. Par exemple : x/tempx; y/temps; etc ...
Corentin je te laisse remplir cette partie
 
  +
  +
La méthode du DTW permet de calculer les dissimilarités entre les informations.
  +
  +
Ici, les deux listes permettent de calculer une matrice dont le dernier élément contient la distance minimal entre les deux listes d'informations.
   
 
===Matrice de radiation===
 
===Matrice de radiation===

Revision as of 19:44, 25 March 2012

Présentation du projet

Le projet de Biométrie "Acquisition et reconnaissance de signatures" consiste à enregistrer une signature numérique d'un client ou utilisateur afin de permettre ultérieurement une identification grâce à cette modalité biométrique.

Contexte

Etude de l'existant

Ce projet d'acquisition et de reconnaissance de signatures a déjà été traité par une équipe d'étudiants en 2010-2011. Nous avons donc étudié ce qui avait été réalisé afin de ne pas perdre les efforts déjà fournis. De cette étude nous avons retenu les conseils et remarques faits sur la partie algorithmique de comparaison de signatures. De plus, nous allons reprendre quelques idées de leur IHM. Pour plus de détails, consulter les parties "Algorithmes" et "IHM".

Suites prévues

L'année prochaine, une nouvelle équipe reprendra surement ce projet de biométrie. Il est donc important de laisser une bonne documentation et des conseils.

Cadre de réponse

Nous réaliserons une IHM qui nous permettra, d'une part, d'enregistrer un nouvel utilisateur dans la base de données (acquisition de signature), et d'autre part de tester l'identification d'un utilisateur. Pour cette identification, la signature sera comparée au modèle calculé et enregistré. Afin de pouvoir effectuer cette comparaison, nous récupèrerons, lors de l'acquisition des signatures, différentes informations qui nous permettront d'appliquer des algorithmes de comparaison de signatures (coordonnées de chaque point, pression du stylet, temps). Il faudra donc étudier les différentes méthodes possibles de comparaison de ces signatures et implémenter l'algorithme conçu à partir de cette étude.

Organisation de l'équipe

Renaud Collin :

  • Chef de projet
  • Responsable documents,
  • Etude de l'existant


Flavien Garcia & Corentin Foucault :

  • Etude de l'existant,
  • Construction et codage de l'algorithme


Christophe Havard :

  • Montage DS + Arduino,
  • Conception et codage IHM


Thibaud Michel :

  • Acquisition des données (depuis le montage DS + Arduino et depuis la tablette),
  • Mise en place de la base de données,
  • Conception et codage IHM


Aurélie Moiroux :

  • Acquisition des données depuis la tablette,
  • Conception et codage IHM

Diagramme de Gantt prévisionnel

Diagramme-de-Gantt-previsionnel.png

Matériel

Tablette Bamboo CTH-460

Cette tablette est un ajout de matériel par rapport à l'année précédente. Ainsi, nous avons pour notre projet deux interfaces pour l'acquisition des signatures. Cela nous a donc amené à étudier la tablette graphique et les librairies Java permettant de nous en servir. L'IHM a également été modifiée pour permettre à l'utilisateur de choisir quelle interface d'acquisition il souhaite utiliser.

  • La librairie permettant d'utiliser cette tablette est : Jpen [1]
  • Le driver de la tablette CTH-460 est disponible ici : [2]


Bamboo.jpg

Montage Arduino + Ecran de DS

Arduino DS.png

Arduino.png

Arduino2.png

IHM

Lorsque l'utilisateur démarre l'application, celle-ci s'ouvre sur l'onglet "Nouvel utilisateur". Si il n'a pas encore de compte, il doit alors rentrer son nom, son prénom, et procéder à l'acquisition de cinq signatures (la même) afin de pouvoir s'enregistrer.


Onglet "Nouvel Utilisateur"

Ihm1.jpg


Une fois que l'utilisateur possède un compte, il peut se rendre sur l'onglet "Identification". Afin de s'authentifier l’utilisateur doit sélectionner son nom, puis signer de la même signature que lors de l'acquisition.


Onglet "Identification"

Ihm2.jpg


Le système affiche alors la réponse de l'authentification : la réussite ou l’échec. Une question apparaît également afin d'établir des statistiques de performance du système.


Ihm21.jpg


Onglet "Infos"


File:Ihm3.jpg

Algorithmes

Un système de reconnaissance par signature nécessite l'application d'algorithmes, que ce soit dans un premier temps pour obtenir des acquisitions de qualité, qu'ensuite pour pouvoir les comparer de manière cohérente et enfin construire un modèle efficace de reconnaissance.

Prétraitement des acquisitions

Les acquisitions obtenues par l'intermédiaire de l'interface, pour représenter la signature d'un individu, sont des listes de points, auquels sont rattachés une abscisse, une coordonnée, une valeur de pression et un temps d'acquisition. Cependant, il est nécessaire d'appliquer un prétraitement à ces acquisitions afin d'en augmenter le nombre de points, corriger les différences entre des signatures successives (décalage, orientation et taille) et également obtenir un nombre de points fixe pour toutes les acquisitions pour pouvoir les comparer.

Voilà une image d'une acquisition originale:

0 origine Aurélie 4.png

1. Ré-échantillonnage sur le temps

La première étape est propre à l'utilisation de la tablette Bamboo et consiste à ne conserver qu'un seul point par temps d'acquisition. En effet, le système d'acquisition de la tablette renvoie la liste de points acquis durant chaque période de 16ms et attache à chaque point cette période d'acquisition plutôt que le temps réel. Par exemple les points acquis en réalité aux temps 11ms et 14,5ms seront enregistrés avec un temps d'acquisition de 16ms alors qu'un point acquis au temps 16,8ms sera enregistré avec un temps d'acquisition de 32ms. Nous avons considéré que ce temps de 16ms étant relativement court, on ne conserverait qu'un seul point pour un même temps d'acquisition (par défaut le premier de la liste).

De plus, on a également considéré que deux points espacés d'un temps d'acquisition supérieur à 32ms correspondait à un lever de stylo.

2. Interpolation

On applique une interpolation cubique sur l'acquisition dans le but d'obtenir un rendu de signature plus continu et lisse, et mieux comprendre les courbures de la signature d'un individu. De plus, il est nécessaire de travailler sur des données assez fournies notamment pour des algorithmes de recouvrement par exemple.

0 interpolee Aurélie 4.png

3. Analyse en composantes principales

PCA.png

L'ACP est utilisé pour trouver les informations mathématiques qui décrivent la position des points: Template:Rouge et Template:Bleu et le centre de gravité d'une forme binaire.

4. Centrage et Rotation

0 centree Aurélie 4.png

0 droite Aurélie 4.png

Pour réduire les problémes de décalage entre l'image à tester et le modèle on utilise les informations fournis par l'ACP. Le centre de gravité permet de centrer l'image comme le modéle. Les deux axes qui décrivent l'alignement des points permettent de faire la rotation.La rotation est calculée à partir de l'angle entre l'axe principal et l'axes horizontal.

5. Normalisation (Zoom)

0 normalisee Aurélie 4.png


Le zoom est calculé pour obtenir la taille la plus grande possible pour l'image.

La distance entre le centre et le point le plus proche du rebord de l'image évaluée = (distance max).

Chaque point subit alors une translation proportionel au rapport (distance du point/distance max)*(demi largeur de l'image)

6. Ré-échantillonnage sur le nombre de points

Suivant la durée totale d'acquisition, le nombre de points acquis peut être plus ou moins important et les précédentes étapes de prétraitement peuvent en supprimer quelque-uns également. Il est donc essentiel d'effectuer un ré-échantillonnage sur les acquisitions après normalisation pour obtenir un nombre de points fixe (2000 points choisis actuellement) pour que les différents algorithmes de comparaison soient cohérents. On a choisi d'interpoler des points de manière uniforme si le nombre de points était inférieur à 2000 et d'en supprimer, également de manière uniforme, si ce nombre était supérieur.

Algorithmes de comparaison

Pour la création du modèle (voir plus loin), il est nécessaire d'obtenir un ensemble de données de comparaisons. On a ainsi sélectionné les comparaisons suivantes

Comparaisons simplistes

  • Différence de temps total d'acquisition
  • Différence de nombre de lever de stylos
  • Différence de pression moyenne

Coefficient de corrélation temporel

Dynamic Time Warping

Les données des signatures sont convertie en graphe temporelle. Par exemple : x/tempx; y/temps; etc ...

La méthode du DTW permet de calculer les dissimilarités entre les informations.

Ici, les deux listes permettent de calculer une matrice dont le dernier élément contient la distance minimal entre les deux listes d'informations.

Matrice de radiation

Corentin je te laisse remplir cette partie

Somme des différences d'angles entre vecteurs

Corentin je te laisse remplir cette partie

Génération d'un modèle classification

Afin de réaliser la tâche de vérification pour la reconnaissance de signature, nous avons opté pour le choix de WEKA pour la création du modèle par apprentissage et la décision finale.

Construction du modèle par apprentissage

WEka utilise des fichiers ARFF pour construire et tester son modèle. Dans ce fichier on retrouve dans l'ordre:

  • Le nom de la relation (utile pour nommer le fichier d'apprentissage aux fichiers d'identification et de décision)

@relation signature

  • La liste des attributs de comparaison utilisés et leur type

@attribute totalTime numeric @attribute numberPenUp numeric ... @attribute CORTX numeric @attribute CORTY numeric @attribute pourcentageRadiance numeric

  • L'attribut contenant les différentes classes (2 dans notre cas: signatures équivalentes ou non)

@attribute accepte {no,yes}

  • Les données de comparaisons entre différentes signatures

@data 1019.466796875,2.0,0.9912756661011811,0.9970564473307176,17.837034225463867,yes 663.466796875,0.0,0.9837515744201278,0.996214642908734,15.106257438659668,yes ... 1278.466796875,0.0,0.9729839482086351,0.9951841501724467,9.820034980773926,no 1044.06640625,0.0,0.9859247460800329,0.9970413832907982,9.922861099243164,no


Pour construire ces données

Classification par arbre de décision

Résultats

Documents