EA2012-Serveux Vocaux

=Présentation= Enseignants : Georges-Pierre Bonneau, Didier Donsez

Auteur : Xiao Lu

Diapositives :

=Abstract= Interactive voice response is actually an automatic proxy of operation. It navigates customers by prerecord voice or speech synthesis technique, then acquire the response of customers by speech recognition technique or keystroke recognition technique, thus implement-ting the Human-Computer interaction.

In my presentation, I’ll introduce you briefly about all the technique required for composing interactive voice response system.

=Résumé= Le serveur vocal est le serveur qui donne vocalement des services aux clients. Il navigue clients en parlant et reçoit réponses soit par les touches de téléphone soit par les paroles de client. Ainsi, cela réalise l’interaction homme-machine. Dans cette présentation, je vais vous montrer les techniques nécessaires pour construire un serveur vocal.

=Mot clé= Serveur vocal, code DTMF, reconnaissance vocale, synthèse vocale

=Synthèse=

Introduction du serveur vocal
Le serveur vocal destiné à donner vocalement des services aux clients qui permet aux utilisateurs d’y accéder au moyen d’un téléphone fixe, mobile ou d'un softphone (Skype, gtalk…).Il est aussi connu sous le nom du système de dialogue.

Selon les statistiques, les réponses de la plupart de questions posées par l’utilisateur peuvent être énumérées en avance.Cela fait penser les gens à remplacer l’homme par la machine.

Les intérêts d’utiliser la machine sont les suivants :

1. Ne se tromper quasiment pas: comparé avec l’homme, la machine ne se fatigue pas et ne se trompe quasiment pas si le code était bien écrit.

2. Réduire le coût de service: une machine peut facilement travailler 24h/24 et remplacer centaine d’opérateurs.

3. Étendre facile:puisque c’est un logiciel, le système doit être étendu s’il est bien conçu. Au lieu de faire une formation du personnel, il ne faut qu’une petite mise à jour sur la machine.

Du serveur à l'utilisateur
Il y a deux genres de techniques pour qu'une machine puisse parler.

Soit par des annonces enregistrées: on enregistre d'avance des annonces dans le serveur vocal. Lors de l'arrivé d'un appel, l'utilisateur entendra l'annonce correspondante.

Les pros:


 * Les annonces seront naturel, claire
 * C'est facile à effectuer.

Les cons:


 * Les annonces sont statiques. Dès qu'il y a des changements, il coûtera cher.

Soit par des annonces en synthèse vocale: on écrit le texte à lire pour le système et l’enregistre dans le serveur vocal. Lors de l'arrivé d'un appel, l'utilisateur entendra l'annonce générée par la machine. Les pros:


 * Les annonces sont dynamiques. S'il y a des changements dessus, il ne faudra que changer du texte.

Les cons:


 * Pour l'instant, les annonces en synthèse vocale ne sont pas assez naturel. L'utilisateur a parfois des difficultés à comprendre.

De l'utilisateur au serveur
Il y a deux genres de techniques qui permettent aux utilisateurs de répondre au serveur vocale.

Soit par code DTMF (Dual-tone multi-frequency signaling): l'utilisateur tapant une touche de téléphone, l'autre côté de téléphone le saura.

Un code DTMF est une combinaison de fréquences. Selon le tableau dessous, chaque touche est lié avec deux fréquences: une haute et une basse. lors qu'une touche est appuyée, le téléphone va envoyer une fréquence combinant les deux fréquences associées. Côté serveur, il va pouvoir distinguer la touche en décodant la fréquence.



Soit par reconnaissance vocale

Applications
=Démo=

=Référence=

http://fr.wikipedia.org/wiki/Code_DTMF