Emploi [stage, ?mois] : TAL/LSF

[Offre diffusée le 22 janvier 2014 sur la liste LN]

Annotation et analyse de corpus de LSF

Encadrant : Michael Filhol et Annelies Braffort

Mots clé : Linguistique de corpus, langue des signes française (LSF)
Objectif : Les langues des signes sont des langues orales, gestuelles, et pour lesquelles les études linguistiques sont récentes et dont les grammaires demeurent très peu connues. Aussi, ces langues sont peu dotées, au sens où les corpus sont encore rares et doivent souvent être constitués par les chercheurs avant d’entreprendre une observation. À partir des corpus vidéo dont dispose l’équipe et d’un travail d’exploration, annotation et analyse, ce stage vise à découvrir et formaliser différents invariants dans les productions signées, en établissant des liens entre les formes observables et les fonctions linguistiques identifiées. Ainsi, le stage contribuera à compléter une base de règles de production, utilisables ensuite en entrée d’un système de génération automatique d’énoncés signés par un signeur virtuel. Selon la durée du stage et les aspirations du candidat, on pourra se concentrer sur une forme particulière (transfert situationnel ou “depicting sign”), un domaine sémantique particulier (expression du temps, des relations topologiques, des comparaisons, de l’opposition, des choix, de la cause…), ou explorer les niveaux supérieurs de construction de la langue comme les structures rhétoriques du discours.
Profil recherché : Master en Sciences du langage, linguistique des langues des signes, TAL. Connaissance de la LSF demandée.

Contexte : L’équipe “M&TALS” du LIMSI s’intéresse au Traitement Automatique de la Langue des Signes Française (LSF), la langue des signes employée par les personnes sourdes en France. C’est une langue naturelle, visuelle et gestuelle : une personne s’exprime en LSF en utilisant de nombreuses composantes corporelles (les mains bien sûr, mais aussi les expressions du visage, le regard, le buste, etc.) et son interlocuteur perçoit le message par le canal visuel. Le fonctionnement linguistique de la LSF est très différent de celui des langues vocales, sa modélisation informatique nécessite de concevoir des représentations spécifiques.
Au sein de l’équipe, nous élaborons des corpus vidéos que nous annotons puis analysons. Nous en déduisons des représentations informatiques du lexique et des énoncés, que nous implémentons puis évaluons. L’équipe développe pour cela des plateformes de génération automatique et d’animation de signeur virtuel. Un signeur virtuel est un personnage 3d virtuel s’exprimant en LSF. Ainsi, les sujets de stages peuvent porter sur des aspects très variés allant de l’analyse de corpus à l’informatique graphique en passant par le traitement automatique des langues, le traitement du signal ou l’ergonomie.

Nature des stages : Les stages sont de niveau master 1 ou 2 ou école d’ingénieur
Rémunération : conventions de stage, gratifications (environ 400 euros/mois)

Responsable de l’équipe : Annelies Braffort
Téléphone : 01 69 85 80 68
Mél : annelies.braffortlimsi.fr
Laboratoire : LIMSI-CNRS, bât 508, bureau 118
Adresse : Campus d’Orsay Bât 508, BP 133, 91403 ORSAY cedex

Lien vers l’offre

Advertisements