Difference between revisions of "EA2014 speech recognition"

From air
Jump to navigation Jump to search
Line 20: Line 20:
   
 
=Synthèse=
 
=Synthèse=
  +
La reconnaissance vocale fait partie des nombreux domaines du traitement de la parole.
   
  +
==Histoire==
  +
Les premiers travaux datent du début du 20e siècle. Mais le premier système pouvant reconnaitre de la parole date de 1952. C’est un système électronique, conçu au sien des laboratoires Bell par trois ingénieurs : Davis, Biddulph et Balashek. Ce système se limitait à reconnaitre quelques chiffres. Vous pouvez consulter le fichier PDF qui contient le résultat de leurs recherches.
  +
En 1972, le premier système de reconnaissance vocale est commercialisé par la société Threshold Technologies. Ce dernier n’est capable de reconnaitre que 32 mots, malgré l’utilisation de méthodes de calculs numériques.
  +
Il faut attendre l’année 1987 avant la commercialisation d’outils pouvant reconnaitre plus de 20 000 mots (le vocabulaire d’un humain contient entre 10 000 et 150 000 mots).
  +
  +
==Algorithmes==
  +
Trois algorithmes sont ou ont été utilisés par les systèmes de reconnaissance :
  +
* La déformation temporelle dynamique [https://en.wikipedia.org/wiki/Hidden_Markov_model]
  +
* Les réseaux de neurones artificiels [https://en.wikipedia.org/wiki/Dynamic_time_warping]
  +
* Le modèle de Markov caché [https://en.wikipedia.org/wiki/Artificial_neural_network]
   
 
=Démonstration=
 
=Démonstration=

Revision as of 19:32, 16 October 2014

Présentation

  • Enseignants : Georges-Pierre Bonneau, Didier Donsez (EA2014)
  • Sujet : Reconnaissance automatique de la parole
  • Date : 17 octobre 2014
  • Auteur : Paul Labat <paul.labat@e.ujf-grenoble.fr>
  • Télécharger les slides de la présentation : Media:EA2104_speech_recognition.pdf

Résumé

La reconnaissance automatique de la parole, plus couramment appelée reconnaissance vocale ou reconnaissance de la parole, est une technique qui permet d'obtenir le texte correspondant à un dialogue. C'est un sujet de recherche complexe et dont les premiers travaux remontent au début du 20e siècle. Le développement des méthodes de reconnaissances vocales a été rendu possible grâce au développement de l'informatique. On retrouve de nos jours la reconnaissance automatique de la parole dans de nombreux domaines d'applications : recherche vocale, saisie de texte, commande vocale, identification vocale, etc.

Mots clefs

Traitement de la parole, langage naturel, traitement du signal, commande vocale, interface utilisateur vocale

Abstract

The speech recognition, also known as automatic speech recognition or speech to text, is a technique that aims to translate a speech into words. It is a complex subject of research and whose early drafts dated of the early 20th century. The development of speech recognition technics was possible thanks to the improvement of computer science. Nowadays, we can find the speech recognition in many applications fields: voice search, text input, voice control, voice identification, etc.

Key Words

Speech processing, natural language, signal processing, voice command, voice user interface

Synthèse

La reconnaissance vocale fait partie des nombreux domaines du traitement de la parole.

Histoire

Les premiers travaux datent du début du 20e siècle. Mais le premier système pouvant reconnaitre de la parole date de 1952. C’est un système électronique, conçu au sien des laboratoires Bell par trois ingénieurs : Davis, Biddulph et Balashek. Ce système se limitait à reconnaitre quelques chiffres. Vous pouvez consulter le fichier PDF qui contient le résultat de leurs recherches. En 1972, le premier système de reconnaissance vocale est commercialisé par la société Threshold Technologies. Ce dernier n’est capable de reconnaitre que 32 mots, malgré l’utilisation de méthodes de calculs numériques. Il faut attendre l’année 1987 avant la commercialisation d’outils pouvant reconnaitre plus de 20 000 mots (le vocabulaire d’un humain contient entre 10 000 et 150 000 mots).

Algorithmes

Trois algorithmes sont ou ont été utilisés par les systèmes de reconnaissance :

  • La déformation temporelle dynamique [1]
  • Les réseaux de neurones artificiels [2]
  • Le modèle de Markov caché [3]

Démonstration

Notes et Références

Liens externes