OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Analyse du bruit pour la prédiction de la qualité de la transcription automatique de la parole

Ferreira, Sébastien and Farinas, Jérome and Pinquier, Julien and Rabant, Stéphane Analyse du bruit pour la prédiction de la qualité de la transcription automatique de la parole. (2019) In: 27e Colloque du Groupe de Recherche sur le Traitement du Signal et des Images (GRETSI 2019), 26 August 2019 - 29 August 2019 (Lille, France).

[img]
Preview
(Document in French)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
357kB

Abstract

De nombreuses sources de variabilité peuvent dégrader les performances des systèmes de Reconnaissance Automatique de la Parole (RAP). Dans cette étude, les dégradations provoquées par le bruit sont analysées afin de prédire a priori la qualité de la RAP, i.e. avant décodage. Notre méthode d'extraction de paramètre, nommée Sub-band Statistical Feature (S-SF), se base sur une séparation de la parole et du bruit. Une fois séparée, des statistiques sont extraites par bande fréquentielle. Pour relier ces paramètres à un système de RAP, un modèle de régression est calculé. L'expérimentation a été réalisée sur le corpus Wall Street Journal, bruité avec le corpus NOISEX-92 (15 types de bruit) que nous appliquons à 9 niveaux de rapport signal sur bruit. La méthode de régression proposée obtient 8,75 d'erreur de prédiction de WER sur un système de RAP entra¿¿né avec des données non-bruitées. Lorsque 20 tours de parole sont utilisés (durée d'environ 140s), l'erreur de prédiction décro¿¿t à 5,82. Notre extraction de S-SF permet une amélioration relative de 20% par rapport à l'extraction des Sub-band Signal-to-Noise Ratio (S-SNR). Cette prédiction peut être utilisée pour ignorer des portions d'audio dont la transcription automatique de la parole est de mauvaise qualité et pour informer l'utilisateur, au plus tôt, de la qualité de la transcription pouvant être obtenue.

Item Type:Conference or Workshop Item (Paper)
HAL Id:hal-02950726
Audience (conference):National conference proceedings
Uncontrolled Keywords:
Institution:French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Other partners > Authôt (FRANCE)
Laboratory name:
Statistics:download
Deposited On:22 Sep 2020 07:34

Repository Staff Only: item control page