Mary-Morstan : un framework modulaire et ...
Type de document :
Thèse
Titre :
Mary-Morstan : un framework modulaire et multiobjectif pour la configuration automatique d’algorithmes de machine learning
Titre en anglais :
Mary-Morstan : a multi-objective modular framework to automatically configure machine learning algorithms
Auteur(s) :
Parmentier, Laurent [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Directeur(s) de thèse :
Laetitia Jourdan
Marie-Eléonore Kessaci
Marie-Eléonore Kessaci
Date de soutenance :
2022-04-06
Président du jury :
Pierre Chainais [Président]
Germain Forestier [Rapporteur]
Edward Keedwell [Rapporteur]
Olivier Nicol
Jalal Fadili
Marius Lindauer
Germain Forestier [Rapporteur]
Edward Keedwell [Rapporteur]
Olivier Nicol
Jalal Fadili
Marius Lindauer
Membre(s) du jury :
Pierre Chainais [Président]
Germain Forestier [Rapporteur]
Edward Keedwell [Rapporteur]
Olivier Nicol
Jalal Fadili
Marius Lindauer
Germain Forestier [Rapporteur]
Edward Keedwell [Rapporteur]
Olivier Nicol
Jalal Fadili
Marius Lindauer
Organisme de délivrance :
Université de Lille
École doctorale :
École doctorale Mathématiques, sciences du numérique et de leurs interactions (Lille ; 2021-....)
NNT :
2022ULILB004
Mot(s)-clé(s) :
Compromis exploration-exploitation
Mot(s)-clé(s) en anglais :
Machine learning
Automation
Evolutionary algorithms
Automation
Evolutionary algorithms
Discipline(s) HAL :
Informatique [cs]/Algorithme et structure de données [cs.DS]
Informatique [cs]/Apprentissage [cs.LG]
Informatique [cs]/Apprentissage [cs.LG]
Résumé :
L'utilisation grandissante de solutions d'apprentissage automatique (recommandation de films, reconnaissance du texte, détection de la fraude et ainsi de suite) crée une demande pour avoir des outils plus efficaces. En ...
Lire la suite >L'utilisation grandissante de solutions d'apprentissage automatique (recommandation de films, reconnaissance du texte, détection de la fraude et ainsi de suite) crée une demande pour avoir des outils plus efficaces. En effet, construire un modèle d'apprentissage automatique est une tâche laborieuse. Le praticien doit formater les données, construire les attributs, sélectionner l'algorithme d'apprentissage automatique adéquat, et régler ses hyperparamètres. Historiquement ces étapes sont manuelles, mais des outils récents appelés AutoML, Automatic Machine Learning, ont vu le jour et proposent de réaliser ces tâches automatiquement. Ainsi, l'AutoML facilite la recherche des modèles et octroie un gain de temps aux experts, et permet également aux non-experts de construire un modèle sans avoir à comprendre les mécanismes sous-jacents. Dans ces travaux, nous analysons les méthodes d'optimisations les plus connues et utilisées par les outils d'AutoML. Lors de notre analyse, nous avons remarqué que parmi ces diverses méthodes, les algorithmes évolutionnaires semblent prometteurs dans la recherche des modèles. Notamment, ils facilitent la configuration de la phase de compromis d’exploration versus exploitation, sont intrinsèquement capables de manipuler toute sorte de candidats (taille fixe ou variable), peuvent aborder plusieurs objectifs et, sont facilement parallélisables. Cependant, ces algorithmes évolutionnaires restent très peu étudiés dans les AutoMLs, en particulier quand cela concerne le choix des composants tels que les mutations ou les algorithmes. Dans ces travaux, nous définissons un framework d'AutoML modulable avec de nouveaux composants. L'objectif est d'étudier l'impact de ces derniers quand ils sont utilisés pour résoudre des problèmes de classification. Par la suite, cela nous a menés au développement d'une méthode qui accélère l'ensemble du processus d'optimisation basé sur les algorithmes évolutionnaires devant traiter d'importants volumes de données. Pour finir, nous proposons une solution qui résout automatiquement le problème de classification des séries temporelles qui, d'après nos connaissances, n'a jamais été étudié auparavant.Lire moins >
Lire la suite >L'utilisation grandissante de solutions d'apprentissage automatique (recommandation de films, reconnaissance du texte, détection de la fraude et ainsi de suite) crée une demande pour avoir des outils plus efficaces. En effet, construire un modèle d'apprentissage automatique est une tâche laborieuse. Le praticien doit formater les données, construire les attributs, sélectionner l'algorithme d'apprentissage automatique adéquat, et régler ses hyperparamètres. Historiquement ces étapes sont manuelles, mais des outils récents appelés AutoML, Automatic Machine Learning, ont vu le jour et proposent de réaliser ces tâches automatiquement. Ainsi, l'AutoML facilite la recherche des modèles et octroie un gain de temps aux experts, et permet également aux non-experts de construire un modèle sans avoir à comprendre les mécanismes sous-jacents. Dans ces travaux, nous analysons les méthodes d'optimisations les plus connues et utilisées par les outils d'AutoML. Lors de notre analyse, nous avons remarqué que parmi ces diverses méthodes, les algorithmes évolutionnaires semblent prometteurs dans la recherche des modèles. Notamment, ils facilitent la configuration de la phase de compromis d’exploration versus exploitation, sont intrinsèquement capables de manipuler toute sorte de candidats (taille fixe ou variable), peuvent aborder plusieurs objectifs et, sont facilement parallélisables. Cependant, ces algorithmes évolutionnaires restent très peu étudiés dans les AutoMLs, en particulier quand cela concerne le choix des composants tels que les mutations ou les algorithmes. Dans ces travaux, nous définissons un framework d'AutoML modulable avec de nouveaux composants. L'objectif est d'étudier l'impact de ces derniers quand ils sont utilisés pour résoudre des problèmes de classification. Par la suite, cela nous a menés au développement d'une méthode qui accélère l'ensemble du processus d'optimisation basé sur les algorithmes évolutionnaires devant traiter d'importants volumes de données. Pour finir, nous proposons une solution qui résout automatiquement le problème de classification des séries temporelles qui, d'après nos connaissances, n'a jamais été étudié auparavant.Lire moins >
Résumé en anglais : [en]
The growing usage of machine learning solutions (movie recommendation, speech recognition, fraud detection and so on) pushes the demand for having more efficient tools to build them. Indeed, building a machine learning ...
Lire la suite >The growing usage of machine learning solutions (movie recommendation, speech recognition, fraud detection and so on) pushes the demand for having more efficient tools to build them. Indeed, building a machine learning model is a tedious task. The practitioner requires to preprocess the data, builds the features, selects the machine learning algorithms and tunes its hyper-parameters. Historically, these steps are handmade, but more recent tools called AutoML for Automatic Machine Learning have blossomed and, propose to perform these tasks automatically. Thus, AutoML eases the research of models and permits a gain of time for the experts but, also aims to help the non-experts to build a model without having to understand all the underlying mechanisms. In this work, we analyze the best known optimization methods used by the AutoML tools, and notice that among these methods, the evolutionary algorithms are very promising when it comes to improve the research of models. Indeed, the evolutionary algorithms ease the tuning of the exploration versus exploitation trade-offs, are inherently capable of handling any sort of candidates (fix and variable sizes), can tackle multiple objectives and can be easily parallelized. However, they have been barely studied on the AutoMLs, especially when it concerns the choice of the components such as the mutations or the algorithms. In this work, we first define a modular AutoML and a range of new components designed to study their impacts when used to automatically solve the classification problems. Then, we come up with a method to accelerate all the optimization processes based on evolutionary algorithms for large datasets. Finally, we propose a solution to automatically tackle the time series classification problems which, to the best of our knowledge, have never been studied before.Lire moins >
Lire la suite >The growing usage of machine learning solutions (movie recommendation, speech recognition, fraud detection and so on) pushes the demand for having more efficient tools to build them. Indeed, building a machine learning model is a tedious task. The practitioner requires to preprocess the data, builds the features, selects the machine learning algorithms and tunes its hyper-parameters. Historically, these steps are handmade, but more recent tools called AutoML for Automatic Machine Learning have blossomed and, propose to perform these tasks automatically. Thus, AutoML eases the research of models and permits a gain of time for the experts but, also aims to help the non-experts to build a model without having to understand all the underlying mechanisms. In this work, we analyze the best known optimization methods used by the AutoML tools, and notice that among these methods, the evolutionary algorithms are very promising when it comes to improve the research of models. Indeed, the evolutionary algorithms ease the tuning of the exploration versus exploitation trade-offs, are inherently capable of handling any sort of candidates (fix and variable sizes), can tackle multiple objectives and can be easily parallelized. However, they have been barely studied on the AutoMLs, especially when it concerns the choice of the components such as the mutations or the algorithms. In this work, we first define a modular AutoML and a range of new components designed to study their impacts when used to automatically solve the classification problems. Then, we come up with a method to accelerate all the optimization processes based on evolutionary algorithms for large datasets. Finally, we propose a solution to automatically tackle the time series classification problems which, to the best of our knowledge, have never been studied before.Lire moins >
Langue :
Anglais
Collections :
Source :
Fichiers
- document
- Accès libre
- Accéder au document
- These_PARMENTIER_Laurent.pdf
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- These_PARMENTIER_Laurent.pdf
- Accès libre
- Accéder au document