Emploi [stage, ?mois] : linguistique

[Offre diffusée sur la liste LN@cines.fr le 4 octobre 2013 par le CEA]

INTRODUCTION
Dans le cadre de la thèse de Quentin Pradet, sous la direction du
Pr. Laurence Danlos et du Dr. Gaël de Chalendar, le CEA LIST et l’INRIA
ALPAGE ont entamé l’adaptation au français de la ressource
lexico-syntaxique VerbNet. Le présent stage qui s’adresse à des
étudiants en linguistique se spécialisant en lexicographie vise à
contribuer à cette traduction.

CONTEXTE
VerbNet est une ressource lexicale pour les verbes anglais organisée
autour de classes sémantiques et de sous-classes syntaxiques. Cette
ressource est très utilisée, notamment pour l’annotation en rôles
sémantiques. Il paraît donc nécessaire d’avoir une ressource équivalente
pour le français. Les seuls efforts qui ont été faits pour l’instant se
limitent à des constructions automatiques bruitées dont l’évaluation se
limite à quelques verbes. De plus ces efforts font abstraction des
ressources lexicales qui existent pour le français, or celles–ci
existent et sont de qualité. Pour les verbes, nous pensons en
particulier à LVF+1, au Lexique-Grammaire et à Dicovalence. Nous avons
donc l’objectif de réaliser un VerbeNet du français semi-automatiquement
en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la
première plus centrée sur les informations sémantiques, la seconde sur
les informations syntaxiques. Ce VerbeNet garde la hiérarchie des
classes sémantiques du VerbNet anglais, ce qui permet de garder à
l’identique les informations sémantiques, entre autres les rôles
thématiques.

OBJECTIFS
La partie automatique exploitant les liens disponibles entre ressources
et un réseau lexico-syntaxique est terminée. Le but de ce stage est de
participer en collaboration étroite avec Laurence Danlos et Quentin
Pradet à la correction manuelle de la ressource à l’aide d’une interface
Web développée en interne.  Pour chaque classe ou sous-classe VerbNet,
on dispose des constructions syntaxiques possibles en anglais, des liens
obtenus automatiquement avec les classes LVF+1 et LG correspondantes et
d’une liste de verbes pouvant appartenir à cette classe. Le travail
consiste en l’édition des frames lexico- syntactico-sémantiques en
réorganisant si nécessaire la hiérarchie de classes, en acceptant ou
refusant les verbes proposés, en modifiant les constructions syntaxiques
et en traduisant les exemples.

CANDIDAT
Nous recherchons pour ce stage un étudiant en linguistique se
spécialisant en lexicographie.

CONTACT
Gaël de Chalendar
gael.de-chalendar@cea.fr
01 69 08 01 50

Advertisements