Traduction neuronale : architectures et ...
Type de document :
Thèse
Titre :
Traduction neuronale : architectures et applications
Titre en anglais :
Neural Machine Translation Architectures and Applications
Auteur(s) :
Bérard, Alexandre [Auteur]
Université de Lille
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Université de Lille
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Directeur(s) de thèse :
olivier pietquin
laurent besacier
laurent besacier
Date de soutenance :
2018-06-15
Organisme de délivrance :
Université de lille
École doctorale :
ED 72, sciences pour l'ingénieur
Mot(s)-clé(s) :
traduction automatique de la parole
Mot(s)-clé(s) en anglais :
neural machine translation
automatic post-editing
automatic speech translation
sequence to sequence learning
encoder-decoder
attention-based models
deep learning
neural networks
word embeddings
automatic post-editing
automatic speech translation
sequence to sequence learning
encoder-decoder
attention-based models
deep learning
neural networks
word embeddings
Discipline(s) HAL :
Informatique [cs]
Résumé :
Cette thèse est centrée sur deux principaux objectifs : l'adaptation de techniques de traduction neuronale à de nouvelles tâches, et la reproduction de travaux de recherche existants. Nos efforts pour la reproductibilité ...
Lire la suite >Cette thèse est centrée sur deux principaux objectifs : l'adaptation de techniques de traduction neuronale à de nouvelles tâches, et la reproduction de travaux de recherche existants. Nos efforts pour la reproductibilité ont résulté en la création de deux ressources : MultiVec, un outil permettant l'utilisation de plusieurs techniques liées au word embeddings; ainsi qu'un outil proposant plusieurs modèles pour la traduction automatique et d’autres tâches similaires (par ex. post-édition automatique). Nous travaillons ensuite sur plusieurs tâches liées à la traduction : la Traduction Automatique (TA), Traduction Automatique de la Parole, et la Post-Édition Automatique. Pour la tâche de TA, nous répliquons des travaux fondateurs basés sur les réseaux de neurones, et effectuons une étude sur des TED Talks, où nous avançons l'état de l'art. La tâche suivante consiste à traduire la parole dans une langue vers le texte dans une autre langue. Dans cette thèse, nous nous concentrons sur le problème inexploré de traduction dite « end-to-end », qui ne passe pas par une transcription intermédiaire dans la langue source. Nous proposons le premier modèle end-to-end, et l'évaluons sur deux problèmes : la traduction de livres audio, et d'expressions de voyage. Notre tâche finale est la post-édition automatique, qui consiste à corriger les sorties d'un système de traduction dans un scénario « boîte noire », en apprenant à partir de données produites par des post-éditeurs humains. Nous étendons des résultats publiés dans le cadre des tâches de WMT 2016 et 2017, et proposons de nouveaux modèles pour la post-édition automatique dans un scénario avec peu de données.Lire moins >
Lire la suite >Cette thèse est centrée sur deux principaux objectifs : l'adaptation de techniques de traduction neuronale à de nouvelles tâches, et la reproduction de travaux de recherche existants. Nos efforts pour la reproductibilité ont résulté en la création de deux ressources : MultiVec, un outil permettant l'utilisation de plusieurs techniques liées au word embeddings; ainsi qu'un outil proposant plusieurs modèles pour la traduction automatique et d’autres tâches similaires (par ex. post-édition automatique). Nous travaillons ensuite sur plusieurs tâches liées à la traduction : la Traduction Automatique (TA), Traduction Automatique de la Parole, et la Post-Édition Automatique. Pour la tâche de TA, nous répliquons des travaux fondateurs basés sur les réseaux de neurones, et effectuons une étude sur des TED Talks, où nous avançons l'état de l'art. La tâche suivante consiste à traduire la parole dans une langue vers le texte dans une autre langue. Dans cette thèse, nous nous concentrons sur le problème inexploré de traduction dite « end-to-end », qui ne passe pas par une transcription intermédiaire dans la langue source. Nous proposons le premier modèle end-to-end, et l'évaluons sur deux problèmes : la traduction de livres audio, et d'expressions de voyage. Notre tâche finale est la post-édition automatique, qui consiste à corriger les sorties d'un système de traduction dans un scénario « boîte noire », en apprenant à partir de données produites par des post-éditeurs humains. Nous étendons des résultats publiés dans le cadre des tâches de WMT 2016 et 2017, et proposons de nouveaux modèles pour la post-édition automatique dans un scénario avec peu de données.Lire moins >
Résumé en anglais : [en]
This thesis is centered on two main objectives: research replication and adaptation of NeuralMachine Translation techniques to new tasks. Our efforts towards research replication have ledto the production of two resources: ...
Lire la suite >This thesis is centered on two main objectives: research replication and adaptation of NeuralMachine Translation techniques to new tasks. Our efforts towards research replication have ledto the production of two resources: MultiVec, a framework that facilitates the use of several tech-niques related to word embeddings (Word2vec, Bivec and Paragraph Vector); and a frameworkfor Neural Machine Translation that implements several architectures and can be used for reg-ular MT, Automatic Post-Editing, and Speech Recognition or Translation. These two resourcesare publicly available and now extensively used by the research community.We extend our NMT framework to work on three related tasks: Machine Translation (MT), Au-tomatic Speech Translation (AST) and Automatic Post-Editing (APE). For the machine transla-tion task, we replicate pioneer neural-based work, and do a case study on TED talks where weadvance the state-of-the-art. Automatic speech translation consists in translating speech fromone language to text in another language. In this thesis, we focus on the unexplored problemof end-to-end speech translation, which does not use an intermediate source-language text tran-scription. We propose the first model for end-to-end AST and apply it on two benchmarks:translation of audiobooks and of basic travel expressions. Our final task is automatic post-editing, which consists in automatically correcting the outputs of an MT system in a black-boxscenario, by training on data that was produced by human post-editors. We replicate and extendpublished results on the WMT 2016 and 2017 tasks, and propose new neural architectures forlow-resource automatic post-editing.Lire moins >
Lire la suite >This thesis is centered on two main objectives: research replication and adaptation of NeuralMachine Translation techniques to new tasks. Our efforts towards research replication have ledto the production of two resources: MultiVec, a framework that facilitates the use of several tech-niques related to word embeddings (Word2vec, Bivec and Paragraph Vector); and a frameworkfor Neural Machine Translation that implements several architectures and can be used for reg-ular MT, Automatic Post-Editing, and Speech Recognition or Translation. These two resourcesare publicly available and now extensively used by the research community.We extend our NMT framework to work on three related tasks: Machine Translation (MT), Au-tomatic Speech Translation (AST) and Automatic Post-Editing (APE). For the machine transla-tion task, we replicate pioneer neural-based work, and do a case study on TED talks where weadvance the state-of-the-art. Automatic speech translation consists in translating speech fromone language to text in another language. In this thesis, we focus on the unexplored problemof end-to-end speech translation, which does not use an intermediate source-language text tran-scription. We propose the first model for end-to-end AST and apply it on two benchmarks:translation of audiobooks and of basic travel expressions. Our final task is automatic post-editing, which consists in automatically correcting the outputs of an MT system in a black-boxscenario, by training on data that was produced by human post-editors. We replicate and extendpublished results on the WMT 2016 and 2017 tasks, and propose new neural architectures forlow-resource automatic post-editing.Lire moins >
Langue :
Anglais
Collections :
Source :
Fichiers
- document
- Accès libre
- Accéder au document
- these-berard.pdf
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- these-berard.pdf
- Accès libre
- Accéder au document