Apprentissage de représentation dirigée par la tâche

Wauquier, Pauline

Type de document :

Thèse

Titre :

Apprentissage de représentation dirigée par la tâche

Titre en anglais :

Task driven representation learning

Auteur(s) :

Wauquier, Pauline [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Machine Learning in Information Networks [MAGNET]

Directeur(s) de thèse :

Marc Tommasi

Date de soutenance :

2017-05-29

Président du jury :

Laetitia Jourdan [Président]
Ludovic Denoyer [Rapporteur]
Emmanuel Viennet [Rapporteur]
Élisa Fromont
Mikaela Keller
Frédérique Grigolato

Membre(s) du jury :

Laetitia Jourdan [Président]
Ludovic Denoyer [Rapporteur]
Emmanuel Viennet [Rapporteur]
Élisa Fromont
Mikaela Keller
Frédérique Grigolato

Organisme de délivrance :

Université Charles de Gaulle - Lille III

École doctorale :

École doctorale Sciences pour l'ingénieur (Lille)

NNT :

2017LIL30005

Mot(s)-clé(s) :

Apprentissage de représentation
Construction de graphe adaptative
Réseau de neurone

Mot(s)-clé(s) en anglais :

Representation learning
Adaptive graph construction
Neural networks

Discipline(s) HAL :

Informatique [cs]/Autre [cs.OH]

Résumé :

De nombreux algorithmes d'Apprentissage automatique ont été proposés afin de résoudre les différentes tâches pouvant être extraites des problèmes de prédiction issus d'un contexte réel. Pour résoudre les différentes tâches ...
Lire la suite >De nombreux algorithmes d'Apprentissage automatique ont été proposés afin de résoudre les différentes tâches pouvant être extraites des problèmes de prédiction issus d'un contexte réel. Pour résoudre les différentes tâches pouvant être extraites, la plupart des algorithmes d'Apprentissage automatique se basent d'une manière ou d'une autre sur des relations liant les instances. Les relations entre paires d'instances peuvent être définies en calculant une distance entre les représentations vectorielles des instances. En se basant sur la représentation vectorielle des données, aucune des distances parmi celles communément utilisées n'est assurée d'être représentative de la tâche à résoudre. Dans ce document, nous étudions l'intérêt d'adapter la représentation vectorielle des données à la distance utilisée pour une meilleure résolution de la tâche. Nous nous concentrons plus précisément sur l'algorithme existant résolvant une tâche de classification en se basant sur un graphe. Nous décrivons d'abord un algorithme apprenant une projection des données dans un espace de représentation permettant une résolution, basée sur un graphe, optimale de la classification. En projetant les données dans un espace de représentation dans lequel une distance préalablement définie est représentative de la tâche, nous pouvons surpasser la représentation vectorielle des données lors de la résolution de la tâche. Une analyse théorique de l'algorithme décrit est développée afin de définir les conditions assurant une classification optimale. Un ensemble d'expériences nous permet finalement d'évaluer l'intérêt de l'approche introduite et de nuancer l'analyse théorique.Lire moins >

Résumé en anglais : [en]

Machine learning proposes numerous algorithms to solve the different tasks that can be extracted from real world prediction problems. To solve the different concerned tasks, most Machine learning algorithms somehow rely ...
Lire la suite >Machine learning proposes numerous algorithms to solve the different tasks that can be extracted from real world prediction problems. To solve the different concerned tasks, most Machine learning algorithms somehow rely on relationships between instances. Pairwise instances relationships can be obtained by computing a distance between the vectorial representations of the instances. Considering the available vectorial representation of the data, none of the commonly used distances is ensured to be representative of the task that aims at being solved. In this work, we investigate the gain of tuning the vectorial representation of the data to the distance to more optimally solve the task. We more particularly focus on an existing graph-based algorithm for classification task. An algorithm to learn a mapping of the data in a representation space which allows an optimal graph-based classification is first introduced. By projecting the data in a representation space in which the predefined distance is representative of the task, we aim at outperforming the initial vectorial representation of the data when solving the task. A theoretical analysis of the introduced algorithm is performed to define the conditions ensuring an optimal classification. A set of empirical experiments allows us to evaluate the gain of the introduced approach and to temper the theoretical analysis.Lire moins >

Langue :

Français

Collections :