Percol0-un système multimodal de détection ...
Type de document :
Communication dans un congrès avec actes
Titre :
Percol0-un système multimodal de détection de personnes dans des documents vidéo
Auteur(s) :
Béchet, Frédéric [Auteur]
Laboratoire d'informatique Fondamentale de Marseille - UMR 6166 [LIF]
Auguste, Rémi [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
FOX MIIRE [LIFL]
Ayache, Stéphane [Auteur]
éQuipe AppRentissage et MultimediA [Marseille] [QARMA]
Charlet, Delphine [Auteur]
France Télécom Recherche & Développement [FT R&D]
Damnati, Géraldine [Auteur]
France Télécom Recherche et Développement [Lannion] [FTR&D]
Favre, Beno\ⁱt [Auteur]
Traitement Automatique du Langage Ecrit et Parlé [TALEP]
Fredouille, Corinne [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Levy, Christophe [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Linarès, Georges [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Martinet, Jean [Auteur]
FOX MIIRE [LIFL]
Laboratoire d'informatique Fondamentale de Marseille - UMR 6166 [LIF]
Auguste, Rémi [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
FOX MIIRE [LIFL]
Ayache, Stéphane [Auteur]
éQuipe AppRentissage et MultimediA [Marseille] [QARMA]
Charlet, Delphine [Auteur]
France Télécom Recherche & Développement [FT R&D]
Damnati, Géraldine [Auteur]
France Télécom Recherche et Développement [Lannion] [FTR&D]
Favre, Beno\ⁱt [Auteur]
Traitement Automatique du Langage Ecrit et Parlé [TALEP]
Fredouille, Corinne [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Levy, Christophe [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Linarès, Georges [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Martinet, Jean [Auteur]
FOX MIIRE [LIFL]
Titre de la manifestation scientifique :
Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP
Ville :
Grenoble
Pays :
France
Date de début de la manifestation scientifique :
2012
Éditeur :
ATALA/AFCP
Date de publication :
2012
Mot(s)-clé(s) :
Détection de visages
Reconnaissance Automatique de la Parole
Segmentation en locuteurs
Reconnaissance de l’écriture
Reconnaissance Automatique de la Parole
Segmentation en locuteurs
Reconnaissance de l’écriture
Mot(s)-clé(s) en anglais :
Face Detection
Optic Character Recognition
Speaker diarization
Automatic speech reconnaissance
Optic Character Recognition
Speaker diarization
Automatic speech reconnaissance
Discipline(s) HAL :
Informatique [cs]/Informatique et langage [cs.CL]
Résumé :
Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la ...
Lire la suite >Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la reconnaissance de personnes dans des documents audiovisuels est un problème difficile à cause des différentes ambiguïtés que présentent l'audio, la vidéo et leur association. Nous présentons dans cette étude le système PERCOL0, développé dans le cadre du défi REPERE, permettant de détecter la présence de personnes (audible et/ou visuelle) dans des documents vidéo, sans utiliser de modèles de locuteurs a priori. ABSTRACT Percol0-A multimodal person detection system in video documents The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities. MOTS-CLÉS : Reconnaissance Automatique de la Parole, Segmentation en locuteurs, reconnaissance de l'écriture, détection de visages.Lire moins >
Lire la suite >Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la reconnaissance de personnes dans des documents audiovisuels est un problème difficile à cause des différentes ambiguïtés que présentent l'audio, la vidéo et leur association. Nous présentons dans cette étude le système PERCOL0, développé dans le cadre du défi REPERE, permettant de détecter la présence de personnes (audible et/ou visuelle) dans des documents vidéo, sans utiliser de modèles de locuteurs a priori. ABSTRACT Percol0-A multimodal person detection system in video documents The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities. MOTS-CLÉS : Reconnaissance Automatique de la Parole, Segmentation en locuteurs, reconnaissance de l'écriture, détection de visages.Lire moins >
Résumé en anglais : [en]
The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in ...
Lire la suite >The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities.Lire moins >
Lire la suite >The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities.Lire moins >
Langue :
Anglais
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Accès libre
- Accéder au document
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Accès libre
- Accéder au document
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- bechet12percol0.pdf
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- bechet12percol0.pdf
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- bechet12percol0.pdf
- Accès libre
- Accéder au document