Message d'erreur

User warning: The following module is missing from the file system: flexifilter. For information about how to fix this, see the documentation page. in _drupal_trigger_error_with_delayed_logging() (line 1143 of /usr/share/drupal7/includes/bootstrap.inc).

Le Réalisateur virtuel (de vidéo)

PRIMA / Patrick Reignier et Dominique Vaufreydaz, 2009

Le réalisateur virtuel de réunions et séminaires : acquisition et transmission automatique de données multimédias

 

Objectifs

1. Motivations

les problèmes scientifiques abordés sont :

Le contexte : la représentation du contexte est un des points clé de l'informatique ubiquitaire. L'objectif est de fournir au concepteur de l'application les outils et les modèles lui permettant de spécifier les contextes d'exécution pertinents par rapport aux actions que peut proposer le système. Le contexte dans le cadre du système d'acquisition correspond au scénario de déroulement d'une présentation.

La reconnaissance du contexte. L'objectif du point précédent est de spécifier un modèle de contexte. Ce modèle doit ensuite être transformé en un programme de reconnaissance correspondant. Il n'y a pas de consensus actuel sur le formalisme d'implémentation : approches bayesiennes, logique prédicative etc.

La perception acoustique. Il s'agit d'une part détecter l'activité vocale et d'autre part de localiser le locuteur ou des bruits dans l'environnement. Les principaux verrous scientifiques que nous souhaitons adresser pour ces 2 tâches sont :

  • Concernant la détection de parole, terminer la mise au point d'un système de détection sans apprentissage préalable des voix des personnes ou des conditions acoustiques de la pièce.
  • Pour la localisation, mise en oeuvre directe d'un système de localisation utilisant une tour de microphones. Le but est de pouvoir poser cette tour à n'importe quel emplacement dans l'environnement, de régler la position des microphones manuellement et de laisser le système calculer la position relative de chacun des microphones), et ce, sans phase spécifique d'apprentissage. Une fois cette position relative définie, le système pourra alors réaliser la localisation.

Scénarii

Les deux scénarios retenus pour la plate-forme LIG sont le séminaire et la réunion. Afin de simplifier, le système d'acquisition sera appelé par la suite « le caméraman ».

2.1 Scénario "séminaire"

Un séminaire se déroule en amphithéâtre. Afin de pouvoir retransmettre, mais également archiver et indexer le contenu des exposés, le caméraman « mobile » est déployé :

  • le PC d'acquisition.
  • les trois caméras numériques : une dirigée vers l'audience, une vers la scène et la zone de projection et une en gros plan sur la salle.
  • le boîtier d'acquisition des transparents.
  • un micro d'ambiance, destiné à détecter la prise de parole dans l'assemblée.
  • un micro pour les questions.
  • un micro cravate pour le locuteur.

Le conférencier et les participants arrivent. Ils s'installent. Le conférencier met son micro cravate. Il branche son PC sur le boîtier d'acquisition des transparents. Ce boîtier est lui même relié au vidéo projecteur. Le chairman de session démarre le caméraman (le programme de la matinée est déjà enregistré dans le système d'information des séminaires). La vue globale de la salle est sélectionnée (pour enregistrement et transmission). Le locuteur démarre sa présentation. La caméra scène + écran est sélectionnée. Lorsqu'il change de transparent (ou qu'il fait une démonstration sur son ordinateur ou qu'il montre une vidéo), la sortie de son PC est sélectionnée. Le locuteur parle maintenant depuis plus de 30 secondes sur le même transparent. Afin de ne pas rester trop longtemps sur le même plan, une vue du transparent et du locuteur incrusté dans une fenêtre est proposée. Une personne dans l'assistance pose une question. la vue de l'assistance est retransmise aux usagers distants. La conférence se termine. Le chairman arrête le caméraman. Les fichiers produits sont :

  • le film monté au format MPEG. Ce film contient la bande son provenant des microphones sélectionnés en fonction du contexte et les images.
  • Les fichiers audio associés à chacun des microphones. Ces fichiers sont destinés à l'indexation.
  • Le fichier timestamp indiquant l'heure de démarrage de l'enregistrement.

L'ensemble de ces fichiers sont transmis sur le serveur central de la plateforme pour y être archivés et indexés1.

2.2 Scénario "Réunion"

Le scénario de la réunion est très similaire à celui du séminaire. Au début de la réunion, le responsable entre les informations : titre de la réunion, nom des participants.

La réunion démarre. Les plans sont choisis en fonction de l'activité devant le tableau blanc et la position dans la salle des personnes prenant la parole. La vidéo montée est à la fois enregistrée pour indexation et est accessible sur internet en streaming via un accès sécurisé par mot de passe. Une fois la réunion terminée, les fichiers générés sont transmis vers le serveur central.