Sunday, September 13, 2009

[rilk-poste] Poste Séparation de sources multicanale. Application à l'annulation d'écho

Séparation de sources multicanale. Application à l'annulation d'écho These DeadLine: 31/12/2009 ivan.bourmeyster@stericsson.com http:// Depuis une décennie, le développement technologique des terminaux mobile va de pair avec une forte tendance à la miniaturisation. Si cette dernière apporte un véritable confort, elle pose de sérieux challenges, et notamment en termes d'acoustique : comment intégrer des haut-parleurs capables de restituer des bandes passantes audio dans des volumes de plus en plus petits ? En téléphonie, miniaturisation et mains-libres (utilisation du terminal en mode "écoute amplifiée") ne font pas non plus bon ménage : la proximité des transducteurs acoustiques haut-parleur/micro se traduit par la présence d'un écho très énergétique (signal HP capté par le micro et retransmis à l'envoyeur), écho qu'il convient de supprimer. Les techniques actuelles d'annulation d'écho dites AEC (Acoustic Echo Cancellation) intégrés dans les terminaux mobile, se basent sur un couple d'observations (1 haut-parleur, 1 microphone) et utilisent un "savant mélange" de filtrage adaptatif linéaire (LMS, APA, …) et ! de post-traitement non-linéaire garantissant une suppression d'écho suffisante. Malgré une très forte activité académique et industrielle sur le sujet, leurs performances restent très perfectibles, notamment en termes d'interactivité : le comportement des terminaux actuels en mode mains-libres ressemble plus à celui d'un talkie-walkie qu'à une véritable communication full-duplex, rendant l'utilisation du mains-libres très problématique. En contrepartie, la miniaturisation permet d'envisager maintenant l'intégration de plusieurs microphones sur un même chipset, ce qui ouvre à l'AEC de nouveaux champs d'investigation qui font l'objet de cette thèse. L'idée force est d'exploiter la dimension spatiale en vue de mieux séparer l'écho du signal utile. L'approche naturelle est de coupler un front-end acoustique de type beamforming (Global Sidelobe Canceller ou autres) avec des techniques classiques d'AEC. L'avantage réside dans la linéarité de cette approche, garante d'une faible distorsion du signal utile. Cependant, au vu du faible nombre de microphones (de 2 à 4) et de la taille réduite du réseau, l'apport du beamforming pourrait s'avérer insuffisant à rendre l'écho inaudible. Une autre perspective sera d'appliquer des approches de type "séparation de sources" aux modules linéaires et non-linéaires. On pourra considérer des approches dites "supervisées" afin d'améliorer le traitement linéaire adaptatif (Kellerma! nn et al. ont sur le sujet développé un nouveau formalisme). Quant au post-traitement non-linéaire qui limite l'interactivité, il pourra bénéficier de l'apport des méthodes de séparation de sources aveugles (BSS) de type DUET par exemple, méthodes qui commencent à montrer des performances intéressantes, y compris en milieu réverbérant. Les algorithmes seront évalués sur des bases de données provenant d'enregistrement réels et devront donc s'avérer robustes face aux conditions rencontrées (bruit, non-linéarités, dispersion des composants, …). La thèse se déroulera conjointement au sein de la société ST-Ericsson basée à Montrouge, 92 et du laboratoire TECH/OPERA d'Orange Labs situé sur les sites de Rennes et Lannion. Au-delà des objectifs scientifiques, l'objectif est de disposer de systèmes d'annulation d'écho implémentables en temps-réel sur des processeurs en virgule fixe, contrainte qu'il conviendra de garder à l'esprit lors des choix algorithmiques. Contacts : ST-Ericsson 29, boulevard Romain Rolland 75669 PARIS Cedex 14 Ivan BOURMEYSTER ivan.bourmeyster@stericsson.com 01.58.07.78.32 gsm : 06.10.37.29.95 Laurent SAID laurent.said@stericsson.com 01.58.07.78.53 gsm : O6.71.58.40.49 Orange Labs Alexandre GUERIN alexandre.guerin@orange-ftgroup.com gsm : 06 88 63 75 94 Université de Rennes 1/ENSSAT Pascal SCALART pascal.scalart@univ-rennes1.fr 02 96 46 90 74 http://gdr-isis.org/rilk/gdr/Kiosque/poste.php?jobid=3439
Séparation de sources multicanale. Application à l'annulation d'écho
These
DeadLine: 31/12/2009
ivan.bourmeyster@stericsson.com
http://

Depuis une décennie, le développement technologique des terminaux mobile va de pair avec une forte tendance à la miniaturisation. Si cette dernière apporte un véritable confort, elle pose de sérieux challenges, et notamment en termes d'acoustique : comment intégrer des haut-parleurs capables de restituer des bandes passantes audio dans des volumes de plus en plus petits ? En téléphonie, miniaturisation et mains-libres (utilisation du terminal en mode "écoute amplifiée") ne font pas non plus bon ménage : la proximité des transducteurs acoustiques haut-parleur/micro se traduit par la présence d'un écho très énergétique (signal HP capté par le micro et retransmis à l'envoyeur), écho qu'il convient de supprimer. Les techniques actuelles d'annulation d'écho dites AEC (Acoustic Echo Cancellation) intégrés dans les terminaux mobile, se basent sur un couple d'observations (1 haut-parleur, 1 microphone) et utilisent un "savant mélange" de filtrage adaptatif linéaire (LMS, APA, …) et !
 de post-traitement non-linéaire garantissant une suppression d'écho suffisante. Malgré une très forte activité académique et industrielle sur le sujet, leurs performances restent très perfectibles, notamment en termes d'interactivité : le comportement des terminaux actuels en mode mains-libres ressemble plus à celui d'un talkie-walkie qu'à une véritable communication full-duplex, rendant l'utilisation du mains-libres très problématique.

En contrepartie, la miniaturisation permet d'envisager maintenant l'intégration de plusieurs microphones sur un même chipset, ce qui ouvre à l'AEC de nouveaux champs d'investigation qui font l'objet de cette thèse. L'idée force est d'exploiter la dimension spatiale en vue de mieux séparer l'écho du signal utile. L'approche naturelle est de coupler un front-end acoustique de type beamforming (Global Sidelobe Canceller ou autres) avec des techniques classiques d'AEC. L'avantage réside dans la linéarité de cette approche, garante d'une faible distorsion du signal utile. Cependant, au vu du faible nombre de microphones (de 2 à 4) et de la taille réduite du réseau, l'apport du beamforming pourrait s'avérer insuffisant à rendre l'écho inaudible. Une autre perspective sera d'appliquer des approches de type "séparation de sources" aux modules linéaires et non-linéaires. On pourra considérer des approches dites "supervisées" afin d'améliorer le traitement linéaire adaptatif (Kellerma!
 nn et al. ont sur le sujet développé un nouveau formalisme). Quant au post-traitement non-linéaire qui limite l'interactivité, il pourra bénéficier de l'apport des méthodes de séparation de sources aveugles (BSS) de type DUET par exemple, méthodes qui commencent à montrer des performances intéressantes, y compris en milieu réverbérant.
Les algorithmes seront évalués sur des bases de données provenant d'enregistrement réels et devront donc s'avérer robustes face aux conditions rencontrées (bruit, non-linéarités, dispersion des composants, …).

La thèse se déroulera conjointement au sein de la société ST-Ericsson basée à Montrouge, 92 et du laboratoire TECH/OPERA d'Orange Labs situé sur les sites de Rennes et Lannion. Au-delà des objectifs scientifiques, l'objectif est de disposer de systèmes d'annulation d'écho implémentables en temps-réel sur des processeurs en virgule fixe, contrainte qu'il conviendra de garder à l'esprit lors des choix algorithmiques.



Contacts :
ST-Ericsson
29, boulevard Romain Rolland
75669 PARIS Cedex 14
Ivan BOURMEYSTER ivan.bourmeyster@stericsson.com 01.58.07.78.32 gsm : 06.10.37.29.95
Laurent SAID laurent.said@stericsson.com 01.58.07.78.53 gsm : O6.71.58.40.49

Orange Labs
Alexandre GUERIN alexandre.guerin@orange-ftgroup.com gsm : 06 88 63 75 94

Université de Rennes 1/ENSSAT
Pascal SCALART pascal.scalart@univ-rennes1.fr  02 96 46 90 74


http://gdr-isis.org/rilk/gdr/Kiosque/poste.php?jobid=3439


Labels: , ,