Mathlouthi, Yosra (2016). Estimation directe et conjointe du flot de scène et de la profondeur à partir d'une séquence monoculaire d'images. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en télécommunications, 162 p.
Prévisualisation |
PDF
Télécharger (7MB) | Prévisualisation |
Résumé
Dans cette thèse, on étudie l'estimation conjointe du flot de scène dense et de la profondeur relative à partir d'une séquence d'images monoculaire. On commence par développer un schéma de base qui permet de poser le problème sous une forme variationnelle par une fonctionnelle composée de deux termes : un terme de conformité aux données spatiotemporelles de la séquence d'images et un terme de régularisation. Le terme de données relie la vitesse tridimensionnelle (3D) et la profondeur en termes de variations spatiotemporelles visuelles. Ce terme s'obtient en remplaçant les coordonnées du vecteur de vitesse optique dans la contrainte du gradient du flot optique de Horn et Schunck par leur expressions en termes du flot de scène et de la profondeur. Sous cette forme, l'énoncé de notre problème est analogue à l'estimation classique du flot optique proposée par Horn et Schunck, quoiqu'elle implique ici le flot de scène et la profondeur au lieu du mouvement de l'image. En premier lieu, on utilise un terme de régularisation L² qui assure une solution lisse partout dans l'image. La discrétisation des équations d'Euler-Lagrange correspondantes à notre fonctionnelle forme un système creux à grande échelle d'équations linéaires. On écrit explicitement ce système et on ordonne ses équations de façon que sa matrice soit symétrique positive définie. Ceci implique que les itérations de Gauss-Seidel convergent point par point ou bloc par bloc, et offre un moyen très efficace pour résoudre les équations d'Euler-Lagrange. En second lieu, une amélioration de la méthode étudiée est proposée par une version qui préserve les frontières du mouvement et des objets dans la scène. Le terme de régularisation L¹ permet le lissage de la solution à l'intérieur des zones uniformes et l'inhibe sur les frontières de mouvement et de profondeur. La discrétisation des équations d'Euler-Lagrange correspondantes à la fonctionnelle de régularisation du type L¹ donne un grand système creux d'équations non-linéaires que l'on peut résoudre en alternant des approximations linéaires avec les itérations de Gauss-Seidel. On considère aussi le problème inverse mal posé du calcul des dérivées spatiotemporelles qui sont nécessaires pour notre problème de flot de scène. On aborde ce calcul par une approche variationnelle, où la fonctionnelle objectif qu'on propose traite l'approximation d'une dérivée de l'image par la minimisation de la somme de deux termes : un terme d'adéquation de l'intégrale des dérivées à l'image et un terme de régularisation. Le terme de données utilise un opérateur d'anti-différentiation ce qui contraint la fonction recherchée à approximer les dérivées de l'image. Le terme de régularisation L² contraint la dérivée à être lisse sur tout le domaine de l'image. La discrétisation des équations d'Euler-Lagrange développées pour la minimisation de la fonctionnelle objectif donne lieu à un grand système creux d'équations linéaires que l'on peut résoudre par la méthode de Gauss-Seidel. Le problème de calcul des dérivées spatio-temporelles est aussi amélioré par une version qui préserve les frontières des objets dans l'image en utilisant une fonction de régularisation L¹. Cette amélioration définit les dérivées de l'image comme des fonctions qui, lorsqu'elles sont intégrées, redonnent l'image à une constante additive près, et qui sont lisses partout sur le domaine de l'image sauf sur les frontières des objets dans l'image. Un grand système creux d'équations non-linéaires découle de la discrétisation des équations d'Euler-Lagrange correspondantes à la fonctionnelle du problème de calcul des dérivées spatio-temporelles amélioré. Ce système est résolu par approximations linéaires successives avec la méthode de Gauss-Seidel. Nous présentons les résultats qualitatifs et quantitatifs de plusieurs tests, avec des images synthétiques et réelles, qui montrent la validité et l'efficacité des méthodes proposées.
Type de document: | Thèse Thèse |
---|---|
Directeur de mémoire/thèse: | Mitiche, Amar |
Co-directeurs de mémoire/thèse: | Ben Ayed, Ismail |
Mots-clés libres: | image derivatives; motion scene flow; monocular sequence; dense scene flow; flot de scène dense; profondeur relative; séquence d'images monoculaire; estimation |
Centre: | Centre Énergie Matériaux Télécommunications |
Date de dépôt: | 26 avr. 2017 13:41 |
Dernière modification: | 26 avr. 2017 13:41 |
URI: | https://espace.inrs.ca/id/eprint/5119 |
Gestion Actions (Identification requise)
Modifier la notice |