Présentation de la campagne d’évaluation ...
Document type :
Communication dans un congrès avec actes
Title :
Présentation de la campagne d’évaluation DEFT 2020 : similarité textuelle en domaine ouvert et extraction d’information précise dans des cas cliniques
Author(s) :
Cardon, Rémi [Auteur]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grabar, Natalia [Auteur]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grouin, Cyril [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Hamon, Thierry [Auteur]
Université Sorbonne Paris Nord
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grabar, Natalia [Auteur]

Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grouin, Cyril [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Hamon, Thierry [Auteur]
Université Sorbonne Paris Nord
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Scientific editor(s) :
Cardon, Rémi
Grabar, Natalia
Grouin, Cyril
Hamon, Thierry
Grabar, Natalia
Grouin, Cyril
Hamon, Thierry
Conference title :
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes
City :
Nancy
Country :
France
Start date of the conference :
2020
Book title :
Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes
Publisher :
ATALA
AFCP
AFCP
Publication date :
2020
Keyword(s) :
similarité textuelle.
extraction d’information
Cas cliniques
extraction d’information
Cas cliniques
HAL domain(s) :
Informatique [cs]/Informatique et langage [cs.CL]
French abstract :
L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de ...
Show more >L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de phrases sur une échelle de 0 (le moins similaire) à 5 (le plus similaire). Les résultats varient de 0,65 à 0,82 d’EDRM. La deuxième tâche consiste à déterminer la phrase la plus proche d’une phrase source parmi trois phrases cibles fournies, avec des résultats très élevés, variant de 0,94 à 0,99 de précision. Ces deux tâches reposent sur un corpus du domaine général et de santé. La troisième tâche propose d’extraire dix catégories d’informations du domaine médical depuis le corpus de cas cliniques de DEFT 2019. Les résultats varient de 0,07 à 0,66 de F-mesure globale pour la sous-tâche des pathologies et signes ou symptômes, et de 0,14 à 0,76 pour la sous-tâche sur huit catégories médicales. Les méthodes utilisées reposent sur des CRF et des réseaux de neurones.Show less >
Show more >L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de phrases sur une échelle de 0 (le moins similaire) à 5 (le plus similaire). Les résultats varient de 0,65 à 0,82 d’EDRM. La deuxième tâche consiste à déterminer la phrase la plus proche d’une phrase source parmi trois phrases cibles fournies, avec des résultats très élevés, variant de 0,94 à 0,99 de précision. Ces deux tâches reposent sur un corpus du domaine général et de santé. La troisième tâche propose d’extraire dix catégories d’informations du domaine médical depuis le corpus de cas cliniques de DEFT 2019. Les résultats varient de 0,07 à 0,66 de F-mesure globale pour la sous-tâche des pathologies et signes ou symptômes, et de 0,14 à 0,76 pour la sous-tâche sur huit catégories médicales. Les méthodes utilisées reposent sur des CRF et des réseaux de neurones.Show less >
Language :
Français
Peer reviewed article :
Oui
Audience :
Non spécifiée
Popular science :
Non
Collections :
Source :
Files
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Open access
- Access the document
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Open access
- Access the document
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Open access
- Access the document
- document
- Open access
- Access the document
- 221.pdf
- Open access
- Access the document