Emploi [stage, ?mois] : TAL/LSF

[Offre diffusée le 22 janvier 2014 sur la liste LN]

Développement de modules d’analyse de textes pour un système de traduction automatique vers la langue des signes

Encadrant : Michael Filhol

Mots clé : Traitement automatique de l’écrit, extraction d’informations sémantiques, traduction automatique

Objectif : L’équipe M&TALS s’intéresse à la problématique de traduction automatique du texte vers la langue des signes, en particulier du français écrit vers la LSF. La langue des signes en sortie est représentée par des scripts en AZee, formalisme proposé par le LIMSI. Celui-ci permet de formaliser des règles de production, c’est-à-dire l’ensemble des articulations (la forme à produire) à partir de fonctions linguistiques (par exemple sémantiques) identifiant les règles. Chaque fonction ainsi identifiée peut être repérée dans les textes par des techniques TAL classiques (extraction sémantique, recherche d’information, etc.) pour déclencher les règles correspondantes, celles-ci produisant les formes signées à utiliser comme traduction de texte initial. Ce sont ces modules de déclenchement de règles que le stage vise à développer. Le stagiaire s’intéressera à développer des scripts, plus ou moins complexes et en utilisant tous les outils à sa disposition pour analyser les textes. En fonction du temps imparti, le stagiaire pourra s’attaquer à un certain nombre de règles prises dans une liste fournie au départ.

Profil recherché : Master en sciences du langage, linguistique informatique, TAL. Sans être obligatoire, toute connaissance de la LSF sera appréciée.

Contexte : L’équipe “M&TALS” du LIMSI s’intéresse au Traitement Automatique de la Langue des Signes Française (LSF), la langue des signes employée par les personnes sourdes en France. C’est une langue naturelle, visuelle et gestuelle : une personne s’exprime en LSF en utilisant de nombreuses composantes corporelles (les mains bien sûr, mais aussi les expressions du visage, le regard, le buste, etc.) et son interlocuteur perçoit le message par le canal visuel. Le fonctionnement linguistique de la LSF est très différent de celui des langues vocales, sa modélisation informatique nécessite de concevoir des représentations spécifiques.
Au sein de l’équipe, nous élaborons des corpus vidéos que nous annotons puis analysons. Nous en déduisons des représentations informatiques du lexique et des énoncés, que nous implémentons puis évaluons. L’équipe développe pour cela des plateformes de génération automatique et d’animation de signeur virtuel. Un signeur virtuel est un personnage 3d virtuel s’exprimant en LSF. Ainsi, les sujets de stages peuvent porter sur des aspects très variés allant de l’analyse de corpus à l’informatique graphique en passant par le traitement automatique des langues, le traitement du signal ou l’ergonomie.

Nature des stages : Les stages sont de niveau master 1 ou 2 ou école d’ingénieur
Rémunération : conventions de stage, gratifications (environ 400 euros/mois)

Responsable de l’équipe : Annelies Braffort
Téléphone : 01 69 85 80 68
Mél : annelies.braffortlimsi.fr
Laboratoire : LIMSI-CNRS, bât 508, bureau 118
Adresse : Campus d’Orsay Bât 508, BP 133, 91403 ORSAY cedex

LIEN vers l’offre

Advertisements