• English
    • français
  • Aide
  •  | 
  • Contact
  •  | 
  • À Propos
  •  | 
  • Ouvrir une session
  • Portail HAL
  •  | 
  • Pages Pro Chercheurs
  • EN
  •  / 
  • FR
Voir le document 
  •   Accueil de LillOA
  • Liste des unités
  • Savoirs, Textes, Langage (STL) - UMR 8163
  • Voir le document
  •   Accueil de LillOA
  • Liste des unités
  • Savoirs, Textes, Langage (STL) - UMR 8163
  • Voir le document
JavaScript is disabled for your browser. Some features of this site may not work without it.

TALC-sef, Un corpus étiqueté de traductions ...
  • BibTeX
  • CSV
  • Excel
  • RIS

Type de document :
Communication dans un congrès avec actes
DOI :
10.1051/shsconf/20140801035
Titre :
TALC-sef, Un corpus étiqueté de traductions littéraires en serbe, anglais et français
Auteur(s) :
Balvet, Antonio [Auteur] refId
Savoirs, Textes, Langage (STL) - UMR 8163 [STL]
Stosic, Dejan [Auteur]
Cognition, Langues, Langage, Ergonomie [CLLE-ERSS]
Miletic, Aleksandra [Auteur]
Cognition, Langues, Langage, Ergonomie [CLLE-ERSS]
Titre de la manifestation scientifique :
Congrès Mondial de Linguistique Française
Ville :
Berlin
Pays :
Allemagne
Date de début de la manifestation scientifique :
2014-07-19
Titre de la revue :
SHS Web of Conferences
Éditeur :
EDP Sciences
Date de publication :
2014
Mot(s)-clé(s) :
Corpus Parallèles
Serbe
Annotation Morpho-syntaxique
Discipline(s) HAL :
Sciences de l'Homme et Société/Linguistique
Résumé :
Le corpus TALC-sef (TAgged Literary Corpus in Serbian, English, French) est un corpus parallèle d'ouvrages littéraires en serbe, anglais et français, étiquetés en parties du discours et librement consultables via une ...
Lire la suite >
Le corpus TALC-sef (TAgged Literary Corpus in Serbian, English, French) est un corpus parallèle d'ouvrages littéraires en serbe, anglais et français, étiquetés en parties du discours et librement consultables via une interface en ligne. Il a été constitué par l'Université d'Arras, en collaboration avec l'Université Lille 3 et l'Université de Belgrade, dans une perspective d'études comparées en stylistique et linguistique. Le corpus TALC-sef représente au total plus de 2 millions de mots, il intègre notamment un corpus étiqueté, corrigé manuellement pour la langue serbe, de 150 000 mots. Dans cet article, nous présentons le mode de constitution du corpus parallèle dans son ensemble, puis nous nous attachons plus spécifiquement à l'élaboration du sous-corpus serbe étiqueté. Nous détaillons les choix linguistiques et techniques sous-jacents à la constitution de ce sous-corpus, qui vient compléter l'offre existante pour la linguistique sur corpus en serbe: à ce jour, le seul corpus librement disponible consiste en une traduction du roman 1984 de G. Orwell (100 000 mots), alors que nous proposons un corpus d'œuvres écrites à l'origine en Serbe, de 150 000 mots. La constitution de ce sous-corpus a permis l'élaboration de modèles d'étiquetage automatique pour trois étiqueteurs syntaxiques, dont Treetagger, TnT et BTagger, le plus efficace d'entre eux. Enfin, nous présentons les perspectives d'évolution du corpus existant, en termes d'enrichissement des annotations syntaxiques (analyses en dépendance en parallèle sur les trois langues), ainsi que les apports d'un tel corpus parallèle étiqueté pour la linguistique du français.Lire moins >
Langue :
Français
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Collections :
  • Savoirs, Textes, Langage (STL) - UMR 8163
Source :
Harvested from HAL
Fichiers
Thumbnail
  • https://halshs.archives-ouvertes.fr/halshs-01077789/document
  • Accès libre
  • Accéder au document
Thumbnail
  • https://www.shs-conferences.org/articles/shsconf/pdf/2014/05/shsconf_cmlf14_01035.pdf
  • Accès libre
  • Accéder au document
Thumbnail
  • https://halshs.archives-ouvertes.fr/halshs-01077789/document
  • Accès libre
  • Accéder au document
Thumbnail
  • https://halshs.archives-ouvertes.fr/halshs-01077789/document
  • Accès libre
  • Accéder au document
Thumbnail
  • document
  • Accès libre
  • Accéder au document
Thumbnail
  • CMLF2014_TALC-sef_15-03-2014.pdf
  • Accès libre
  • Accéder au document
Thumbnail
  • shsconf_cmlf14_01035.pdf
  • Accès libre
  • Accéder au document
Université de Lille

Mentions légales
Accessibilité : non conforme
Université de Lille © 2017