Emploi [stage, ?mois] : linguistique

[Offre diffusée le 27 novembre 2013 sur la liste parislinguist]

Adaptation française de VerbNet

INTRODUCTION
Dans le cadre de la thèse de Quentin Pradet, sous la direction du Pr. Laurence
Danlos et du Dr. Gaël de Chalendar, le CEA LIST et l’INRIA ALPAGE ont entamé
l’adaptation au français de la ressource lexico-syntaxique VerbNet. Le présent
stage vise à contribuer à cette traduction.

CONTEXTE
VerbNet est une ressource lexicale pour les verbes anglais organisée autour de
classes sémantiques et de sous-classes syntaxiques. Cette ressource est très
utilisée, notamment pour l’annotation en rôles sémantiques. Il paraît donc
nécessaire d’avoir une ressource équivalente pour le français. Les seuls
efforts qui ont été faits pour l’instant se limitent à des constructions
automatiques bruitées dont l’évaluation se limite à quelques verbes. De plus
ces efforts font abstraction des ressources lexicales qui existent pour le
français, or celles-ci existent et sont de qualité. Pour les verbes, nous
pensons en particulier à LVF+1, au Lexique-Grammaire et à Dicovalence. Nous
avons donc l’objectif de réaliser un VerbeNet du français semi-automatiquement
en nous appuyant sur ces ressources, en particulier sur LVF+1 et LG, la
première plus centrée sur les informations sémantiques, la seconde sur les
informations syntaxiques. Ce VerbeNet garde la hiérarchie des classes
sémantiques du VerbNet anglais, ce qui permet de garder à l’identique les
informations sémantiques, entre autres les rôles thématiques.

OBJECTIFS
La partie automatique exploitant les liens disponibles entre ressources et un
réseau lexico-syntaxique est terminée. Le but de ce stage est de participer en
collaboration étroite avec Laurence Danlos et Quentin Pradet à la correction
manuelle de la ressource à l’aide d’une interface Web développée en interne.
Pour chaque classe ou sous-classe VerbNet, on dispose des constructions
syntaxiques possibles en anglais, des liens obtenus automatiquement avec les
classes LVF+1 et LG correspondantes et d’une liste de verbes pouvant
appartenir à cette classe. Le travail consiste en l’édition des frames lexico-
syntactico-sémantiques en réorganisant si nécessaire la hiérarchie de
classes, en acceptant ou refusant les verbes proposés, en modifiant les
constructions syntaxiques et en traduisant les exemples.

CANDIDAT ET DEROULEMENT
Nous recherchons pour ce stage un étudiant en linguistique avec si possible
des notions de lexicographie.

Le stage se déroulera au laboratoire LVIC du CEA LIST, dans les locaux de Nano
Innov à Palaiseau, en étroite collaboration avec Laurence Danlos à Paris. La
rémunération est autour de 700€ pour un étudiant de M2, plus une éventuelle
prime de fin de stage.

CONTACT
Gaël de Chalendar
gael.de-chalendar@cea.fr
01 69 08 01 50


Gael de Chalendar
CEA LIST
Laboratoire Vision et Ingénierie des Contenus
(Vision and Content Engineering Laboratory)

CEA SACLAY – NANO INNOV
BAT. 861
Point courier 173
91191 GIF SUR YVETTE

Tél.:+33.1.69.08.01.50 Fax:+33.1.69.08.01.15
Email : Gael.D.O.T.de-Chalendar.A@T.cea.D.O.T.fr

Advertisements