MultiVec: a Multilingual and Multilevel ...
Type de document :
Autre communication scientifique (congrès sans actes - poster - séminaire...): Communication dans un congrès avec actes
Titre :
MultiVec: a Multilingual and Multilevel Representation Learning Toolkit for NLP
Auteur(s) :
Bérard, Alexandre [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Sequential Learning [SEQUEL]
Servan, Christophe [Auteur]
Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole [GETALP ]
Pietquin, Olivier [Auteur]
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Institut universitaire de France [IUF]
Université de Lille, Sciences et Technologies
Besacier, Laurent [Auteur]
Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole [GETALP ]
Institut universitaire de France [IUF]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Sequential Learning [SEQUEL]
Servan, Christophe [Auteur]
Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole [GETALP ]
Pietquin, Olivier [Auteur]
Sequential Learning [SEQUEL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Institut universitaire de France [IUF]
Université de Lille, Sciences et Technologies
Besacier, Laurent [Auteur]
Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole [GETALP ]
Institut universitaire de France [IUF]
Titre de la manifestation scientifique :
The 10th edition of the Language Resources and Evaluation Conference (LREC)
Ville :
Portoroz
Pays :
Slovénie
Date de début de la manifestation scientifique :
2016-05-23
Date de publication :
2016-05-23
Mot(s)-clé(s) en anglais :
Word embeddings
paragraph vector
bilingual word embeddings
crosslingual document classification
paragraph vector
bilingual word embeddings
crosslingual document classification
Discipline(s) HAL :
Informatique [cs]/Traitement du texte et du document
Résumé en anglais : [en]
We present MultiVec, a new toolkit for computing continuous representations for text at different granularity levels (word-level or sequences of words). MultiVec includes Mikolov et al. [2013b]'s word2vec features, Le and ...
Lire la suite >We present MultiVec, a new toolkit for computing continuous representations for text at different granularity levels (word-level or sequences of words). MultiVec includes Mikolov et al. [2013b]'s word2vec features, Le and Mikolov [2014]'s paragraph vector (batch and online) and Luong et al. [2015]'s model for bilingual distributed representations. MultiVec also includes different distance measures between words and sequences of words. The toolkit is written in C++ and is aimed at being fast (in the same order of magnitude as word2vec), easy to use, and easy to extend. It has been evaluated on several NLP tasks: the analogical reasoning task, sentiment analysis, and crosslingual document classification.Lire moins >
Lire la suite >We present MultiVec, a new toolkit for computing continuous representations for text at different granularity levels (word-level or sequences of words). MultiVec includes Mikolov et al. [2013b]'s word2vec features, Le and Mikolov [2014]'s paragraph vector (batch and online) and Luong et al. [2015]'s model for bilingual distributed representations. MultiVec also includes different distance measures between words and sequences of words. The toolkit is written in C++ and is aimed at being fast (in the same order of magnitude as word2vec), easy to use, and easy to extend. It has been evaluated on several NLP tasks: the analogical reasoning task, sentiment analysis, and crosslingual document classification.Lire moins >
Langue :
Anglais
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal.archives-ouvertes.fr/hal-01335930/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-01335930/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-01335930/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- Berard_and_al-MultiVec_a_Multilingual_and_Multilevel_Representation-LREC2016.pdf
- Accès libre
- Accéder au document