Acquisition non supervisée de ressources ...
Document type :
Autre communication scientifique (congrès sans actes - poster - séminaire...): Communication dans un congrès avec actes
Title :
Acquisition non supervisée de ressources morphologiques en ukrainien
Author(s) :
Grabar, Natalia [Auteur]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Hamon, Thierry [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Université Paris 13 [UP13]
![refId](/themes/Mirage2//images/idref.png)
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Hamon, Thierry [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Université Paris 13 [UP13]
Conference title :
atelier Traitement Automatique des Langues Slaves
City :
Caen
Country :
France
Start date of the conference :
2015-01-01
English keyword(s) :
Ukrainien
langues peu dotées
corpus
morphologie
acquisition de ressources
méthodes non supervisées
langues peu dotées
corpus
morphologie
acquisition de ressources
méthodes non supervisées
HAL domain(s) :
Informatique [cs]
Informatique [cs]/Informatique et langage [cs.CL]
Informatique [cs]/Informatique et langage [cs.CL]
English abstract : [en]
La disponibilité de ressources morphologiques est un besoin important et récurrent car elles permettent le développement des outils et applications de TAL dans une langue. De telles ressources fournissent, en effet, les ...
Show more >La disponibilité de ressources morphologiques est un besoin important et récurrent car elles permettent le développement des outils et applications de TAL dans une langue. De telles ressources fournissent, en effet, les informations de base dont ces outils ont besoin pour effectuer des traitements plus évolués (recherche d'information, étiquetage morpho-syntaxiques, etc). Nous proposons d'effectuer l'acquisition de ressources morphologiques pour la langue ukrainienne, qui est une langue peu dotée actuellement. La méthode proposée exploite des corpus afin d'en extraire les mots qui sont liés morphologiquement entre eux. La force d'association entre ces mots indique la probabilité du lien morphologique et sémantique entre eux. Nous utilisons trois corpus (littéraire, médical et encyclopédique) et évaluons les résultats obtenus. Selon les corpus, la précision varie entre 67 % et 86 %. Les résultats sont aussi comparés entre les corpus, ce qui montre que la redondance est assez faible. La ressource actuellement disponible contient 3 315 paires de mots validées.Show less >
Show more >La disponibilité de ressources morphologiques est un besoin important et récurrent car elles permettent le développement des outils et applications de TAL dans une langue. De telles ressources fournissent, en effet, les informations de base dont ces outils ont besoin pour effectuer des traitements plus évolués (recherche d'information, étiquetage morpho-syntaxiques, etc). Nous proposons d'effectuer l'acquisition de ressources morphologiques pour la langue ukrainienne, qui est une langue peu dotée actuellement. La méthode proposée exploite des corpus afin d'en extraire les mots qui sont liés morphologiquement entre eux. La force d'association entre ces mots indique la probabilité du lien morphologique et sémantique entre eux. Nous utilisons trois corpus (littéraire, médical et encyclopédique) et évaluons les résultats obtenus. Selon les corpus, la précision varie entre 67 % et 86 %. Les résultats sont aussi comparés entre les corpus, ce qui montre que la redondance est assez faible. La ressource actuellement disponible contient 3 315 paires de mots validées.Show less >
Language :
Anglais
Peer reviewed article :
Oui
Audience :
Non spécifiée
Popular science :
Non
Collections :
Source :