Présentation de la campagne d’évaluation ...
Type de document :
Communication dans un congrès avec actes
Titre :
Présentation de la campagne d’évaluation DEFT 2020 : similarité textuelle en domaine ouvert et extraction d’information précise dans des cas cliniques
Auteur(s) :
Cardon, Rémi [Auteur]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grabar, Natalia [Auteur]
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grouin, Cyril [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Hamon, Thierry [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Université Sorbonne Paris Nord
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grabar, Natalia [Auteur]

Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Grouin, Cyril [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Hamon, Thierry [Auteur]
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur [LIMSI]
Université Sorbonne Paris Nord
Éditeur(s) ou directeur(s) scientifique(s) :
Cardon, Rémi
Grabar, Natalia
Grouin, Cyril
Hamon, Thierry
Grabar, Natalia
Grouin, Cyril
Hamon, Thierry
Titre de la manifestation scientifique :
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes
Ville :
Nancy
Pays :
France
Date de début de la manifestation scientifique :
2020
Titre de l’ouvrage :
Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Atelier DÉfi Fouille de Textes
Éditeur :
ATALA
AFCP
AFCP
Date de publication :
2020
Mot(s)-clé(s) :
similarité textuelle.
extraction d’information
Cas cliniques
extraction d’information
Cas cliniques
Discipline(s) HAL :
Informatique [cs]/Informatique et langage [cs.CL]
Résumé :
L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de ...
Lire la suite >L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de phrases sur une échelle de 0 (le moins similaire) à 5 (le plus similaire). Les résultats varient de 0,65 à 0,82 d’EDRM. La deuxième tâche consiste à déterminer la phrase la plus proche d’une phrase source parmi trois phrases cibles fournies, avec des résultats très élevés, variant de 0,94 à 0,99 de précision. Ces deux tâches reposent sur un corpus du domaine général et de santé. La troisième tâche propose d’extraire dix catégories d’informations du domaine médical depuis le corpus de cas cliniques de DEFT 2019. Les résultats varient de 0,07 à 0,66 de F-mesure globale pour la sous-tâche des pathologies et signes ou symptômes, et de 0,14 à 0,76 pour la sous-tâche sur huit catégories médicales. Les méthodes utilisées reposent sur des CRF et des réseaux de neurones.Lire moins >
Lire la suite >L’édition 2020 du défi fouille de texte (DEFT) a proposé deux tâches autour de la similarité textuelle et une tâche d’extraction d’information. La première tâche vise à identifier le degré de similarité entre paires de phrases sur une échelle de 0 (le moins similaire) à 5 (le plus similaire). Les résultats varient de 0,65 à 0,82 d’EDRM. La deuxième tâche consiste à déterminer la phrase la plus proche d’une phrase source parmi trois phrases cibles fournies, avec des résultats très élevés, variant de 0,94 à 0,99 de précision. Ces deux tâches reposent sur un corpus du domaine général et de santé. La troisième tâche propose d’extraire dix catégories d’informations du domaine médical depuis le corpus de cas cliniques de DEFT 2019. Les résultats varient de 0,07 à 0,66 de F-mesure globale pour la sous-tâche des pathologies et signes ou symptômes, et de 0,14 à 0,76 pour la sous-tâche sur huit catégories médicales. Les méthodes utilisées reposent sur des CRF et des réseaux de neurones.Lire moins >
Langue :
Français
Comité de lecture :
Oui
Audience :
Non spécifiée
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-02784737v3/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- 221.pdf
- Accès libre
- Accéder au document