Percol0-un système multimodal de détection ...
Document type :
Communication dans un congrès avec actes
Title :
Percol0-un système multimodal de détection de personnes dans des documents vidéo
Author(s) :
Béchet, Frédéric [Auteur]
Laboratoire d'informatique Fondamentale de Marseille - UMR 6166 [LIF]
Auguste, Rémi [Auteur]
FOX MIIRE [LIFL]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Ayache, Stéphane [Auteur]
éQuipe AppRentissage et MultimediA [Marseille] [QARMA]
Charlet, Delphine [Auteur]
France Télécom Recherche & Développement [FT R&D]
Damnati, Géraldine [Auteur]
France Télécom Recherche et Développement [Lannion] [FTR&D]
Favre, Beno\ⁱt [Auteur]
Traitement Automatique du Langage Ecrit et Parlé [TALEP]
Fredouille, Corinne [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Levy, Christophe [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Linarès, Georges [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Martinet, Jean [Auteur]
FOX MIIRE [LIFL]
Laboratoire d'informatique Fondamentale de Marseille - UMR 6166 [LIF]
Auguste, Rémi [Auteur]
FOX MIIRE [LIFL]
Laboratoire d'Informatique Fondamentale de Lille [LIFL]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Ayache, Stéphane [Auteur]
éQuipe AppRentissage et MultimediA [Marseille] [QARMA]
Charlet, Delphine [Auteur]
France Télécom Recherche & Développement [FT R&D]
Damnati, Géraldine [Auteur]
France Télécom Recherche et Développement [Lannion] [FTR&D]
Favre, Beno\ⁱt [Auteur]
Traitement Automatique du Langage Ecrit et Parlé [TALEP]
Fredouille, Corinne [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Levy, Christophe [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Linarès, Georges [Auteur]
Laboratoire Informatique d'Avignon [LIA]
Martinet, Jean [Auteur]
FOX MIIRE [LIFL]
Conference title :
Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP
City :
Grenoble
Country :
France
Start date of the conference :
2012
Publisher :
ATALA/AFCP
Publication date :
2012
Keyword(s) :
Détection de visages
Reconnaissance Automatique de la Parole
Segmentation en locuteurs
Reconnaissance de l’écriture
Reconnaissance Automatique de la Parole
Segmentation en locuteurs
Reconnaissance de l’écriture
English keyword(s) :
Face Detection
Optic Character Recognition
Speaker diarization
Automatic speech reconnaissance
Optic Character Recognition
Speaker diarization
Automatic speech reconnaissance
HAL domain(s) :
Informatique [cs]/Informatique et langage [cs.CL]
French abstract :
Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la ...
Show more >Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la reconnaissance de personnes dans des documents audiovisuels est un problème difficile à cause des différentes ambiguïtés que présentent l'audio, la vidéo et leur association. Nous présentons dans cette étude le système PERCOL0, développé dans le cadre du défi REPERE, permettant de détecter la présence de personnes (audible et/ou visuelle) dans des documents vidéo, sans utiliser de modèles de locuteurs a priori. ABSTRACT Percol0-A multimodal person detection system in video documents The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities. MOTS-CLÉS : Reconnaissance Automatique de la Parole, Segmentation en locuteurs, reconnaissance de l'écriture, détection de visages.Show less >
Show more >Identifier et nommer à chaque instant d'une vidéo l'ensemble des personnes présentes à l'image ou s'exprimant dans la bande son fait parti de ces nouveaux outils de fouille de données. D'un point de vue scientifique la reconnaissance de personnes dans des documents audiovisuels est un problème difficile à cause des différentes ambiguïtés que présentent l'audio, la vidéo et leur association. Nous présentons dans cette étude le système PERCOL0, développé dans le cadre du défi REPERE, permettant de détecter la présence de personnes (audible et/ou visuelle) dans des documents vidéo, sans utiliser de modèles de locuteurs a priori. ABSTRACT Percol0-A multimodal person detection system in video documents The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities. MOTS-CLÉS : Reconnaissance Automatique de la Parole, Segmentation en locuteurs, reconnaissance de l'écriture, détection de visages.Show less >
English abstract : [en]
The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in ...
Show more >The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities.Show less >
Show more >The goal of the PERCOL project is to participate to the REPERE multimodal evaluation program by building a consortium combining different scientific fields (audio, text and video) in order to perform person recognition in video documents. The two main scientific challenges we are addressing are firstly multimodal fusion algorithms for automatic person recognition in video broadcast ; and secondly the improvement of information extraction from speech and images thanks to a combine decoding using both modalities to reduce decoding ambiguities.Show less >
Language :
Anglais
Peer reviewed article :
Oui
Audience :
Internationale
Popular science :
Non
Collections :
Source :
Files
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Open access
- Access the document
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Open access
- Access the document
- https://hal-amu.archives-ouvertes.fr/hal-01194254/document
- Open access
- Access the document
- document
- Open access
- Access the document
- bechet12percol0.pdf
- Open access
- Access the document
- document
- Open access
- Access the document
- bechet12percol0.pdf
- Open access
- Access the document