Dépôt numérique
RECHERCHER

Séparation aveugle de signaux de parole utilisant les statistiques d'ordre supérieur et la décomposition en sous-espaces.

Benabderrahmane, Yasmina (2011). Séparation aveugle de signaux de parole utilisant les statistiques d'ordre supérieur et la décomposition en sous-espaces. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en télécommunications, 185 p.

[img]
Prévisualisation
PDF
Télécharger (12MB) | Prévisualisation

Résumé

Au cours des dernières décennies, beaucoup d'attention a été accordée à la séparation aveugle de sources. Dans plusieurs situations, il est souhaitable de récupérer toutes les sources à partir des mélanges enregistrés, ou du moins de séparer une source particulière. Cette thèse est focalisée sur l'étude de la séparation aveugle de sources dans le cas de mélanges instantanés et convolutifs ; en particulier, des sources de signaux de parole. La première partie de ce rapport de thèse est consacrée aux mélanges instantanés. Nous présentons les résultats d'une étude comparative sur les méthodes de séparation aveugle de signaux de parole. Nous avons développé une méthode utilisant les moments d’ordre supérieur : HOS (High Order Statistics), exploitant l’hypothèse de l’indépendance des signaux. La deuxième approche que nous avons développée est basée sur la méthode de l’analyse en composantes principales orientées (OPCA : Oriented Principal Components Analysis). C’est une méthode utilisant les statistiques du second ordre et qui représente une extension de l’analyse en composantes principales (PCA) visant à maximiser le rapport de puissance d'une paire de signaux. L'avantage de cette méthode par rapport aux autres techniques de second ordre est l'absence de l’étape du pré-blanchiment. L’évaluation des techniques développées a été effectuée en les comparant avec une approche de référence connue : Fast-ICA (Fast-Independant Component Analysis). Dans la deuxième partie de cette thèse, nous nous placerons dans une situation plus réaliste et donc plus complexe où nous considérerons un mélange convolutif. Les expériences ont été réalisées en considérant deux types de mélange : un mélange convolutif suivant le modèle HRTF (Head Related Transfert Function) et un mélange convolutif anéchoïque. Les deux mélanges sont enregistrés dans des milieux non réverbérants. Nous avons appliqué une approche que nous avons appelée FOPCA. L’idée était d’étendre l'algorithme OPCA aux mélanges convolutifs en l’appliquant dans le domaine fréquentiel. Cette méthode présente l’avantage de ne pas produire le problème de permutation de fréquences. L’évaluation a été réalisée en faisant la comparaison des résultats avec deux algorithmes de référence connus : Degenerate Unmixing Evaluation Technique (DUET) and Convolutive Fast Independent Component Analysis (C-FICA). Le cas sous- déterminé a été aussi considéré. Toutes les techniques ont été objectivement comparées en utilisant cinq métriques différentes : le domaine temporel, le spectrogramme, le coefficient de corrélation, le rapport signal-à-interférence : SIR, ainsi que le PESQ (Perceptual Evaluation Signal Quality). Pour des fins de comparaison subjective, nous avons utilisé une méthode basée sur la note d’opinion moyenne : le MOS. Les résultats des expériences ont été réalisés en utilisant les bases de données TIMIT, Noizeus ainsi que d’autres enregistrements plus longs des signaux de parole.

Type de document: Thèse
Directeur de mémoire/thèse: O'Shaughnessy, Douglas
Co-directeurs de mémoire/thèse: Selouani, Sid-Ahmed
Mots-clés libres: séparation aveugle de sources; signaux de parole; statistiques du second ordre; statistiques d’ordre supérieur; mélanges instantanés; mélanges convolutifs
Centre: Centre Énergie Matériaux Télécommunications
Date de dépôt: 06 août 2014 20:57
Dernière modification: 09 nov. 2015 20:48
URI: http://espace.inrs.ca/id/eprint/2132

Actions (Identification requise)

Modifier la notice Modifier la notice