De l’analyse en composantes principales ...
Type de document :
Thèse
Titre :
De l’analyse en composantes principales fonctionnelle à l’autoencodeur convolutif profond sur les trajectoires de formes de Kendall pour l’analyse et la reconnaissance de la démarche en 3D
Titre en anglais :
From functional PCA to Convolutional Deep AE on Kendall’s Shape Trajectories for 3D Gait Analysis and Recognition
Auteur(s) :
Hosni, Nadia [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Université de Lille
Ecole nationale supérieure Mines-Télécom Lille Douai [IMT Nord Europe]
GRIFT - ENSI - TUNISIE [GRIFT]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Université de Lille
Ecole nationale supérieure Mines-Télécom Lille Douai [IMT Nord Europe]
GRIFT - ENSI - TUNISIE [GRIFT]
Directeur(s) de thèse :
Boulbaba Ben Amor
Faouzi Ghorbel
Faouzi Ghorbel
Date de soutenance :
2020-11-26
Président du jury :
Azza Ouled Zaid [Rapporteur]
Christophe Rosenberger (rapporteur)
Moncef Tagina
Franck Multon (examinateur)
Valérie Burdin (examinateur)
Slim M’Hiri
Christophe Rosenberger (rapporteur)
Moncef Tagina
Franck Multon (examinateur)
Valérie Burdin (examinateur)
Slim M’Hiri
Membre(s) du jury :
Azza Ouled Zaid [Rapporteur]
Christophe Rosenberger (rapporteur)
Moncef Tagina
Franck Multon (examinateur)
Valérie Burdin (examinateur)
Slim M’Hiri
Christophe Rosenberger (rapporteur)
Moncef Tagina
Franck Multon (examinateur)
Valérie Burdin (examinateur)
Slim M’Hiri
Organisme de délivrance :
Universite de Lille, Lille, FRA.
École doctorale :
Ecole Doctorale SPI Université Lille Nord de France
Mot(s)-clé(s) :
Analyse de formes
Géométrie différentielle
Biométrie comportementale
Analyse et classification de séquences squelettiques
Reconnaissance de la démarche en 3D
Machine learning.
Géométrie différentielle
Biométrie comportementale
Analyse et classification de séquences squelettiques
Reconnaissance de la démarche en 3D
Machine learning.
Mot(s)-clé(s) en anglais :
3D Shape analysis
Differential geometry
Behavioral biometrics
Skeletal sequences analysis and classification
3D gait recognition
Machine learning.
Differential geometry
Behavioral biometrics
Skeletal sequences analysis and classification
3D gait recognition
Machine learning.
Discipline(s) HAL :
Informatique [cs]/Vision par ordinateur et reconnaissance de formes [cs.CV]
Résumé :
Récemment, le développement de solutions automatiques et intelligentes pour la com-préhension du contenu des vidéos et plus particulièrement pour l’analyse spatio-temporelledes mouvements Humains est au cœur de plusieurs ...
Lire la suite >Récemment, le développement de solutions automatiques et intelligentes pour la com-préhension du contenu des vidéos et plus particulièrement pour l’analyse spatio-temporelledes mouvements Humains est au cœur de plusieurs domaines de recherche tels que lesvidéos surveillances, les interactions Homme-Machine et la rééducation. Dans ce projetde thèse, nous proposons de procéder à l’analyse et la reconnaissance de la démarche en3D qui est aussi un domaine de recherche actif en biométrie comportementale grâce aucaractère non-invasif (aucune coopération de l’utilisateur), convivial (user-friendly) et bonmarché de la démarche. Cette dernière a suscité plus d’intérêt avec la démocratisationde caméras de profondeurs bon marché (e.g., la Kinect), capables d’estimer en tempsréel et de manière relativement précise les squelettes 3D et leurs mouvements, quand lapersonne est dans le champ de vue du capteur. Mais ces données squelettiques souffrentde la variabilité temporelle et spatiale. Pour faire face à ces verrous, nous proposons desnouvelles approches à partir de données squelettiques 3D où une séquence est d’abordreprésentée sur l’espace de formes de Kendall S par une trajectoire paramétrée par le temps.Les variabilités liées à l’échelle, la translation et la rotation sont ainsi filtrées. Cependant,vu la structure sphérique (non-linéaire) de la variété S, il n’est pas possible d’appliquer destechniques d’apprentissage automatique conventionnelle directement. C’est pourquoi nousavons eu recours à quelques outils de la géométrie riemannienne pour gérer le problèmede non linéarité. Notre première contribution présente une adaptation de l’Analyse enComposantes Principales Fonctionnelle (ACP fonctionnelle), qui tient compte de la non-linéarité de l’espace de Kendall S. A l’issue de l’étape d’apprentissage, une nouvelle basede trajectoires principales, i.e., fonctions principales, est constituée. Étant donné unenouvelle trajectoire, elle est projetée sur cette nouvelle base avant d’être classée par uneMachine à Vecteurs de Support (SVM). Les résultats expérimentaux sur différentes basesde données sont très compétitifs comparés à la littérature avec en plus une signature pluscompacte et plus robuste. De plus, motivés par la puissance des réseaux de neurones et de l’apprentissage profond (Deep Learning), nous proposons, en deuxième méthode, unautoencodeur convolutif profond à caractère géométrique puisqu’il analyse les trajectoiresde formes précédemment citées tout en tenant compte de la structure géométrique de notreespace de représentation. En fait, des étapes géométriques assurent que ces trajectoirespeuvent être transmises à l’autoencodeur convolutif pour aboutir à une représentationcompacte et discriminante permettant une bonne identification des personnes, et ce sansavoir recours à aucune technique d’alignement (e.g., DTW) ni de modélisation temporelle(e.g., HMM, RNN). Les résultats obtenus sur plusieurs bases publiques sont prometteurspar application à la reconnaissance de la démarche en 3D.Lire moins >
Lire la suite >Récemment, le développement de solutions automatiques et intelligentes pour la com-préhension du contenu des vidéos et plus particulièrement pour l’analyse spatio-temporelledes mouvements Humains est au cœur de plusieurs domaines de recherche tels que lesvidéos surveillances, les interactions Homme-Machine et la rééducation. Dans ce projetde thèse, nous proposons de procéder à l’analyse et la reconnaissance de la démarche en3D qui est aussi un domaine de recherche actif en biométrie comportementale grâce aucaractère non-invasif (aucune coopération de l’utilisateur), convivial (user-friendly) et bonmarché de la démarche. Cette dernière a suscité plus d’intérêt avec la démocratisationde caméras de profondeurs bon marché (e.g., la Kinect), capables d’estimer en tempsréel et de manière relativement précise les squelettes 3D et leurs mouvements, quand lapersonne est dans le champ de vue du capteur. Mais ces données squelettiques souffrentde la variabilité temporelle et spatiale. Pour faire face à ces verrous, nous proposons desnouvelles approches à partir de données squelettiques 3D où une séquence est d’abordreprésentée sur l’espace de formes de Kendall S par une trajectoire paramétrée par le temps.Les variabilités liées à l’échelle, la translation et la rotation sont ainsi filtrées. Cependant,vu la structure sphérique (non-linéaire) de la variété S, il n’est pas possible d’appliquer destechniques d’apprentissage automatique conventionnelle directement. C’est pourquoi nousavons eu recours à quelques outils de la géométrie riemannienne pour gérer le problèmede non linéarité. Notre première contribution présente une adaptation de l’Analyse enComposantes Principales Fonctionnelle (ACP fonctionnelle), qui tient compte de la non-linéarité de l’espace de Kendall S. A l’issue de l’étape d’apprentissage, une nouvelle basede trajectoires principales, i.e., fonctions principales, est constituée. Étant donné unenouvelle trajectoire, elle est projetée sur cette nouvelle base avant d’être classée par uneMachine à Vecteurs de Support (SVM). Les résultats expérimentaux sur différentes basesde données sont très compétitifs comparés à la littérature avec en plus une signature pluscompacte et plus robuste. De plus, motivés par la puissance des réseaux de neurones et de l’apprentissage profond (Deep Learning), nous proposons, en deuxième méthode, unautoencodeur convolutif profond à caractère géométrique puisqu’il analyse les trajectoiresde formes précédemment citées tout en tenant compte de la structure géométrique de notreespace de représentation. En fait, des étapes géométriques assurent que ces trajectoirespeuvent être transmises à l’autoencodeur convolutif pour aboutir à une représentationcompacte et discriminante permettant une bonne identification des personnes, et ce sansavoir recours à aucune technique d’alignement (e.g., DTW) ni de modélisation temporelle(e.g., HMM, RNN). Les résultats obtenus sur plusieurs bases publiques sont prometteurspar application à la reconnaissance de la démarche en 3D.Lire moins >
Résumé en anglais : [en]
In the field of Computer Vision and Pattern Recognition, human behavior understandinghas attracted the attention of several research groups and specialized companies. Successfulintelligent solutions will be playing an ...
Lire la suite >In the field of Computer Vision and Pattern Recognition, human behavior understandinghas attracted the attention of several research groups and specialized companies. Successfulintelligent solutions will be playing an important role in applications which involve human-robot or human-computer interaction, biometrics recognition (security), and physicalperformance assessment (healthcare and well-being) since it will help the human beingswere their cognitive and limited capabilities cannot perform well. In my thesis project, weinvestigate the problem of 3D gait recognition and analysis as gait is user-friendly and awell-accepted technology especially with the availability of RGB-D sensors and algorithmsfor detecting and tracking of human landmarks in video streams. Unlike other biometricssuch as fingerprints, face or iris, it can be acquired at a large distance and do not requireany collaboration of the end user. This point makes gait recognition suitable in intelligentvideo surveillance problems used, for example, in the security field as one of the behavioralbiometrics or in healthcare as good physical patterns. However, using 3D human bodytracked landmarks to provide such motions’ analysis faces many challenges like spatial andtemporal variations and high dimension. Hence, in this thesis, we propose novel frameworksto infer 3D skeletal sequences for the purpose of 3D gait analysis and recognition. Theyare based on viewing the above-cited sequences as time-parameterized trajectories on theKendall shape space S, results of modding out shape-preserving transformations, i.e.,scaling, translation and rotation. Considering the non-linear structure of the manifold onwhich these shape trajectories are lying, the use of the conventional machine learning toolsand the standard computational tools cannot be straightforward. Hence, we make use ofgeometric steps related to the Riemannian geometry in order to handle the problem of non-linearity. Our first contribution is a geometric-functional framework for 3D gait analysiswith a direct application to behavioral biometric recognition and physical performanceassessment. We opt for an extension of the functional Principal Component Analysis tothe underlying space. This functional analysis of trajectories, grounding on the geometryof the space of representation, allows to extract compact and efficient biometric signatures.In addition, we also propose a geometric deep convolutional auto-encoder (DCAE) forthe purpose of gait recognition from time-varying 3D skeletal data. To accommodate theNeural Network architectures to obtained manifold-valued trajectories on the underlyingnon-linear space S, these trajectories are mapped to a certain vector space by means of someRiemannien geometry tools, prior to the encoding-decoding scheme. Without applying anyprior temporal alignment step (e.g., Dynamic Time Warping) or modeling (e.g., HMM,RNN), they are then fed to a convolutional auto-encoder to build an identity-relevantlatent space that showed discriminating capacities for identifying persons when no TemporalAlignment is applied to the time-parametrized gait trajectories: Efficient gait patterns areextracted. Both approaches were tested on several publicly available datasets and showspromising results.Lire moins >
Lire la suite >In the field of Computer Vision and Pattern Recognition, human behavior understandinghas attracted the attention of several research groups and specialized companies. Successfulintelligent solutions will be playing an important role in applications which involve human-robot or human-computer interaction, biometrics recognition (security), and physicalperformance assessment (healthcare and well-being) since it will help the human beingswere their cognitive and limited capabilities cannot perform well. In my thesis project, weinvestigate the problem of 3D gait recognition and analysis as gait is user-friendly and awell-accepted technology especially with the availability of RGB-D sensors and algorithmsfor detecting and tracking of human landmarks in video streams. Unlike other biometricssuch as fingerprints, face or iris, it can be acquired at a large distance and do not requireany collaboration of the end user. This point makes gait recognition suitable in intelligentvideo surveillance problems used, for example, in the security field as one of the behavioralbiometrics or in healthcare as good physical patterns. However, using 3D human bodytracked landmarks to provide such motions’ analysis faces many challenges like spatial andtemporal variations and high dimension. Hence, in this thesis, we propose novel frameworksto infer 3D skeletal sequences for the purpose of 3D gait analysis and recognition. Theyare based on viewing the above-cited sequences as time-parameterized trajectories on theKendall shape space S, results of modding out shape-preserving transformations, i.e.,scaling, translation and rotation. Considering the non-linear structure of the manifold onwhich these shape trajectories are lying, the use of the conventional machine learning toolsand the standard computational tools cannot be straightforward. Hence, we make use ofgeometric steps related to the Riemannian geometry in order to handle the problem of non-linearity. Our first contribution is a geometric-functional framework for 3D gait analysiswith a direct application to behavioral biometric recognition and physical performanceassessment. We opt for an extension of the functional Principal Component Analysis tothe underlying space. This functional analysis of trajectories, grounding on the geometryof the space of representation, allows to extract compact and efficient biometric signatures.In addition, we also propose a geometric deep convolutional auto-encoder (DCAE) forthe purpose of gait recognition from time-varying 3D skeletal data. To accommodate theNeural Network architectures to obtained manifold-valued trajectories on the underlyingnon-linear space S, these trajectories are mapped to a certain vector space by means of someRiemannien geometry tools, prior to the encoding-decoding scheme. Without applying anyprior temporal alignment step (e.g., Dynamic Time Warping) or modeling (e.g., HMM,RNN), they are then fed to a convolutional auto-encoder to build an identity-relevantlatent space that showed discriminating capacities for identifying persons when no TemporalAlignment is applied to the time-parametrized gait trajectories: Efficient gait patterns areextracted. Both approaches were tested on several publicly available datasets and showspromising results.Lire moins >
Langue :
Anglais
Collections :
Source :