Analyse de formes pour la compréhension ...
Type de document :
Habilitation à diriger des recherches
URL permanente :
Titre :
Analyse de formes pour la compréhension du comportement humain
Titre en anglais :
Shape Analysis for Human Behavior Understanding
Auteur(s) :
Drira, Hassen [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]

Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Directeur(s) de thèse :
Daoudi, Mohamed
Date de soutenance :
2020-07-02
Président du jury :
Colot, Olivier
Organisme de délivrance :
Université de Lille
École doctorale :
École doctorale Sciences pour l'Ingénieur (Lille)
Laboratoires ou autres structures partenaires :
Laboratoire CERI SN, IMT Lille Douai
Mot(s)-clé(s) :
Reconnaissance des formes (informatique)
Reconnaissance de l'activité humaine
Biométrie douce
Représentation parcimonieuse
Géométrie de Riemann
Espace de forme de Kendall
Variétés de Riemann
Géodésiques (mathématiques)
Invariance de jauge
Reconnaissance de l'activité humaine
Biométrie douce
Représentation parcimonieuse
Géométrie de Riemann
Espace de forme de Kendall
Variétés de Riemann
Géodésiques (mathématiques)
Invariance de jauge
Mot(s)-clé(s) en anglais :
Shape recognition (computer science)
Human activity recognition
Soft biometrics
Sparse representation
Riemannian geometry
Kendall's shape space
Riemannian manifolds
Geodesics (mathematics)
Gauge invariance
Human activity recognition
Soft biometrics
Sparse representation
Riemannian geometry
Kendall's shape space
Riemannian manifolds
Geodesics (mathematics)
Gauge invariance
Résumé :
L'analyse visuelle des mouvements humains est l'un des domaines de recherche les plus actifs en vision par ordinateur. Elle vise à détecter, suivre et identifier les personnes, et plus généralement, d'interpréter les ...
Lire la suite >L'analyse visuelle des mouvements humains est l'un des domaines de recherche les plus actifs en vision par ordinateur. Elle vise à détecter, suivre et identifier les personnes, et plus généralement, d'interpréter les comportements humains, à partir de séquences d'images impliquant des humains. Cette Habilitation a pour thème principal l'analyse de forme des données d'imagerie avec application à l'analyse du comportement humain. En particulier, pour filtrer certaines transformations indésirables, les formes extraites du corps et du visage humain sont représentées comme des éléments d'un espace de formes défini comme invariant sous l'action de groupes modélisant les transformations indésirables. La principale contribution présentée dans cette habilitation est un cadre unifié pour l'analyse du comportement humain à travers de multiples variétés représentant différentes données, avec différentes applications allant de la reconnaissance d'action à l'estimation de la biométrie douce, y compris l'analyse et la classification des expressions faciales. Premièrement, les landmarks issus des skeletons humains ou du visage sont modélisés sur l'espace de forme de Kendall où la comparaison est invariante à l'échelle, à la translation et à la rotation. Un codage parcimonieux intrinsèque sur l'espace de forme de Kendall a été effectué avec une application à la reconnaissance d'action et d'expression à partir de landmarks dynamiques. Une étude comparative à un codage extrinsèque parcimonieux est également présentée pour comprendre les avantages de chaque méthodologie. Deuxièmement, les courbes faciales ont été vues comme des points sur une variété de dimension infinie et un vecteur de vélocité le long d'une géodésique représentant les déformations faciales entre les visages 3D a été proposé avec une application à la reconnaissance des biométries douces à partir de visages 3D et à la reconnaissance d'expressions faciales à partir de visages 3D dynamiques. Enfin, un cadre pour les surfaces 3D paramétrées est présenté. Nous présentons les algorithmes pour calculer les géodésiques, les distances et les moyens intrinsèques. Une nouvelle idée basée sur la théorie de jauge capable de calculer les chemins géodésiques sur l'espace de forme sans avoir besoin de filtrer le groupe de re-paramétrisation est proposée. Les expériences menées sur les principaux benchmarks de reconnaissance d'action, d'expression faciales et de reconnaissance de biométries douces démontrent l'efficacité du cadre proposé pour l’analyse et la compréhension du comportement humain.Lire moins >
Lire la suite >L'analyse visuelle des mouvements humains est l'un des domaines de recherche les plus actifs en vision par ordinateur. Elle vise à détecter, suivre et identifier les personnes, et plus généralement, d'interpréter les comportements humains, à partir de séquences d'images impliquant des humains. Cette Habilitation a pour thème principal l'analyse de forme des données d'imagerie avec application à l'analyse du comportement humain. En particulier, pour filtrer certaines transformations indésirables, les formes extraites du corps et du visage humain sont représentées comme des éléments d'un espace de formes défini comme invariant sous l'action de groupes modélisant les transformations indésirables. La principale contribution présentée dans cette habilitation est un cadre unifié pour l'analyse du comportement humain à travers de multiples variétés représentant différentes données, avec différentes applications allant de la reconnaissance d'action à l'estimation de la biométrie douce, y compris l'analyse et la classification des expressions faciales. Premièrement, les landmarks issus des skeletons humains ou du visage sont modélisés sur l'espace de forme de Kendall où la comparaison est invariante à l'échelle, à la translation et à la rotation. Un codage parcimonieux intrinsèque sur l'espace de forme de Kendall a été effectué avec une application à la reconnaissance d'action et d'expression à partir de landmarks dynamiques. Une étude comparative à un codage extrinsèque parcimonieux est également présentée pour comprendre les avantages de chaque méthodologie. Deuxièmement, les courbes faciales ont été vues comme des points sur une variété de dimension infinie et un vecteur de vélocité le long d'une géodésique représentant les déformations faciales entre les visages 3D a été proposé avec une application à la reconnaissance des biométries douces à partir de visages 3D et à la reconnaissance d'expressions faciales à partir de visages 3D dynamiques. Enfin, un cadre pour les surfaces 3D paramétrées est présenté. Nous présentons les algorithmes pour calculer les géodésiques, les distances et les moyens intrinsèques. Une nouvelle idée basée sur la théorie de jauge capable de calculer les chemins géodésiques sur l'espace de forme sans avoir besoin de filtrer le groupe de re-paramétrisation est proposée. Les expériences menées sur les principaux benchmarks de reconnaissance d'action, d'expression faciales et de reconnaissance de biométries douces démontrent l'efficacité du cadre proposé pour l’analyse et la compréhension du comportement humain.Lire moins >
Résumé en anglais : [en]
As one of the most active research areas in computer vision, visual analysis of human motion attempts to detect, track and identify people, and more generally, to interpret human behaviors, from image sequences involving ...
Lire la suite >As one of the most active research areas in computer vision, visual analysis of human motion attempts to detect, track and identify people, and more generally, to interpret human behaviors, from image sequences involving humans. The main concern of this dissertation is the issue of shape analysis of imaging data with application to human behavior analysis. In particular, to filter some undesirable transformations, the shape extracted from the human body and face are represented as elements of a shape space defined as the invariant under the action of groups modeling the undesirable transformations. The main contribution presented in this dissertation is a unified framework for human behavior analysis through multiple manifolds representing different data, with different applications ranging from action recognition to soft-biometrics estimation including facial expression analysis and classification. First, the landmarks issued from the skeleton or facial landmarks were modeled on Kendall shape space where the comparison is invariant to scale, translation and rotation. An intrinsic sparse coding and dictionary learning SCDL on the Kendall Shape Space were performed with application to action and expression recognition using dynamic landmarks. A comparative study to an extrinsic sparse coding is also presented to understand the benefit of each methodology. Second, the facial curves were viewed as points on an infinite-dimensional, dfferentiable manifold and shooting vector along a geodesic representing the deformations between 3D faces has been proposed with application to soft-biometric recognition from 3D faces and expression recognition from 3D dynamic faces. Finally, a framework for 3D parametrized surfaces is presented. We present the algorithms to calculate geodesic paths, distances and intrinsic means. A novel idea based on gauge theory capable to compute the geodesic paths on shape space without any need to filter the re-parameterization group is proposed. Experiments conducted on the main benchmarks of action, facial expression and soft-biometric recognition demonstrate the efficiency of the proposed framework on the task of human behavior understanding.Lire moins >
Lire la suite >As one of the most active research areas in computer vision, visual analysis of human motion attempts to detect, track and identify people, and more generally, to interpret human behaviors, from image sequences involving humans. The main concern of this dissertation is the issue of shape analysis of imaging data with application to human behavior analysis. In particular, to filter some undesirable transformations, the shape extracted from the human body and face are represented as elements of a shape space defined as the invariant under the action of groups modeling the undesirable transformations. The main contribution presented in this dissertation is a unified framework for human behavior analysis through multiple manifolds representing different data, with different applications ranging from action recognition to soft-biometrics estimation including facial expression analysis and classification. First, the landmarks issued from the skeleton or facial landmarks were modeled on Kendall shape space where the comparison is invariant to scale, translation and rotation. An intrinsic sparse coding and dictionary learning SCDL on the Kendall Shape Space were performed with application to action and expression recognition using dynamic landmarks. A comparative study to an extrinsic sparse coding is also presented to understand the benefit of each methodology. Second, the facial curves were viewed as points on an infinite-dimensional, dfferentiable manifold and shooting vector along a geodesic representing the deformations between 3D faces has been proposed with application to soft-biometric recognition from 3D faces and expression recognition from 3D dynamic faces. Finally, a framework for 3D parametrized surfaces is presented. We present the algorithms to calculate geodesic paths, distances and intrinsic means. A novel idea based on gauge theory capable to compute the geodesic paths on shape space without any need to filter the re-parameterization group is proposed. Experiments conducted on the main benchmarks of action, facial expression and soft-biometric recognition demonstrate the efficiency of the proposed framework on the task of human behavior understanding.Lire moins >
Langue :
Anglais
Collections :
Date de dépôt :
2021-06-28T13:23:23Z
Fichiers
- HDR_DRIRA_Hassen.pdf
- Non spécifié
- Accès libre
- Accéder au document