Emploi [stage, 4 à 6 mois] : TAL

[Offre diffusée le 7 décembre 2013 sur la liste LN]

Acquisition d’un analyseur en dépendances du français médiéval

Dans le cadre du projet ANR Syntactic Reference Corpus of Medieval
French (SRCMF, 2008-2011), un Treebank (une collection d’arbres)
d’analyses en dépendances d’énoncés du français médiéval a été
constitué. Il comprend 260 000 mots (parmi lesquels environ 27 000 têtes
verbales) annotées en étiquettes morpho-syntaxiques et reliés par des
relations de dépendances étiquetées.

L’objectif du stage est d’exploiter ce corpus par apprentissage
automatique afin d’acquérir un analyseur en dépendances du français
médiéval, éventuellement couplé à un étiqueteur morpho-syntaxique. Ces
outils pourront être exploités sur de nouveaux textes. Ils permettront
d’étudier précisément les spécificités grammaticales du français
médiéval, en comparaison avec celles du français contemporain.

Le stage bénéficiera de l’encadrement d’une spécialiste du français
médiéval (Sophie Prévost) et de spécialistes du TAL et de
l’apprentissage automatique (Matthieu Constant et Isabelle Tellier).

Compétences requises :
– niveau M2 ou ingénieur en informatique ou en TAL
– Connaissances (ou au minimum intérêt argumenté) en TAL et en
apprentissage automatique
– Compétences en programmation

Conditions du stage :
– Rémunération : prime de stage (1/3 du SMIC).
– Durée : 4 à 6 mois en commençant dès que possible en 2014.
– Lieu : le stage sera encadré en collaboration par le LIGM à
Marne-la-vallée (http://ligm.u-pem.fr) et le Lattice à Montrouge
(http://www.lattice.cnrs.fr), trajets à prévoir entre les deux lieux

envoyer CV + lettre de motivation à Matthieu Constant
(Matthieu.Constant@u-pem.fr), Sophie Prévost (sophie.prevost@ens.fr),
Isabelle Tellier (isabelle.tellier@univ-paris3.fr)

Advertisements