ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Auteurs : soumettez
votre article en ligne
Autres revues >>

Traitement du Signal

0765-0019
Signal, Image, Parole
 

 ARTICLE VOL 34/3-4 - 2017  - pp.137-151  - doi:10.3166/ts.34.137-151
TITRE
Analyse sur les réseaux de croyances profondes pour la reconnaissance de phonèmes dans la parole tamoule continue

TITLE
Deep belief networks for phoneme recognition in continuous Tamil speech–an analysis

RÉSUMÉ

Une combinaison du modèle de mélange gaussien et du modèle de Markov caché a été utilisée avec succès dans la construction de modèles acoustiques pour la reconnaissance automatique de la parole. Ces modèles jouent des roles dominents depuis près de trois décennies. La réinsertion de réseaux de neurones dans de nombreux problèmes de regroupement, de classification et de reconnaissance de formes a amené les chercheurs actuels à se concentrer sur l'utilisation de son pouvoir dans le domaine de la reconnaissance automatique de la parole. Cet article compare les performances des réseaux de croyances profondes Bernoulli-Bernoulli (BBDBN en anglais) et des réseaux de croyances profondes Gaussian-Bernoulli (GBDBN en anglais) sur la reconnaissance phonémique de la parole tamoule. En outre, l'impact de la représentation de caractéristique sur les performances du modèle acoustique est également étudié à l'aide de trois bases de données différents construits en utilisant la représentation de caractéristique différentes pour les extraits de phonèmes dans la parole tamoule continue.



ABSTRACT

Acombination of Gaussian Mixture Model and Hidden Markov Model has been used successfully in building acoustic models for speech recognition. These models have dominated this area for nearly three decades. Re-entry of neural networks in many clustering, classification and pattern recognition problems have triggered current researchers to focus in making use of its power in the area of speech recognition. This article compares the performance of Bernoulli-Bernoulli Deep Belief Networks (BBDBN) and Gaussian-Bernoulli Deep BeliefNetworks (GBDBN) on phoneme recognition ofspoken speech in Tamil. In addition to that the impact of feature representation in the performance of acoustic model is also studied by using three different datasets built using different feature representation for the phoneme samples extracted from the continuous Tamil speech.



AUTEUR(S)
Laxmi SREE BASKARAN RAGURAM, Vijaya MADHAYA SHANMUGAM

MOTS-CLÉS
réseaux de croyances profondes, reconnaissance de phonèmes, reconnaissance automatique de la parole, réseaux de neurones artificiels, apprentissage en profondeur, parole tamoule, modèle acoustique, parole continue, bernoulli-bernoulli, gaussian-bernoulli.

KEYWORDS
deep belief networks, phoneme recognition, speech recognition, artificial neural networks, deep learning, tamil speech, acoustic model, continuous speech, bernoulli-bernoulli, gaussian-bernoulli.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 7.5 €
• Non abonné : 15.0 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (260 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
Lavoisier