Poste Reconnaissance dévénements dans les documents vidéo.
Reconnaissance dévénements dans les documents vidéo.
These
DeadLine: 31/10/2009
Georges.Quenot@imag.fr
http://mrim.imag.fr/georges.quenot/postes/These-Quaero-3-FR.pdf
Lindexation par le contenu des documents vidéo est un problème difficile en raison de la « distance » existant entre les tableaux de nombres codant ces documents et les concepts avec lesquels on souhaite les annoter. Des méthodes existent pour la reconnaissance automatique de concepts « statiques» comme les objets, les lieux ou les personnes. Ces méthodes ont déjà un certain nombre de limitations,
notamment en termes de performance et de généralité. La reconnaissance de concepts « dynamiques » comme latterrissage dun avion, un saut en longueur ou une poignée de main entre deux personnes est encore plus difficile car il faut alors reconnaître des séquences détats, eux-mêmes difficiles à reconnaître. Des méthodes existent déjà là aussi, basées par exemple sur lutilisation de modèles de Markov cachés mais elles ne fonctionnent pour linstant que dans des contextes extrêmement spécifiques (peu de types dévénements et peu de types de vidéo) et sur des volumes de données très réduits en raison de leur grande complexité.
Le sujet proposé concerne létude de méthodes pour lindexation des événements dans les documents vidéo capables de fonctionner dans un cadre général (pour une large gamme dévénements et pour un grand nombre de types de documents) et à grande échelle (utilisable pour des grandes bases de vidéo). Lapproche reposera sur la reconnaissance locale de concepts stables (objets, visages, mains, etc.) et sur leur suivi dans les séquences dimage composant les plans vidéo. Des modèles statistiques seront appris à partir dun nombre important de séquences annotées et ces modèles seront ensuite utilisés pour la reconnaissance. Une part importante du travail sera liée au choix de descripteurs appropriés pour la représentation des éléments, des relations entre eux et des évolutions de ces relations. Ces descripteurs seront utilisés pour la construction des modèles statistiques.
Les méthodes développées seront évaluées dans le cadre de campagnes nationales ou internationales comme TRECVID (http://www-nlpir.nist.gov/projects/trecvid/). Le travail se fera dans le contexte du programme Quaero (http://www.quaero.org). Celui-ci permettra entre autres choses davoir accès à un grand volume de données vidéo annotées et de travailler sur des types dévénements réellement utiles pour les applications industrielles.
http://mrim.imag.fr/georges.quenot/postes/These-Quaero-3-FR.pdf
http://mrim.imag.fr/georges.quenot/postes/These-Quaero-3-EN.pdf
Labels: job, phd, research position

<< Home