Emploi [CDD, 2 ans] : linguiste-informaticien

[Offre diffusée sur la liste LN@cines.fr]

Dans le cadre du projet de recherche franco-allemand PRESTO co-financé
par les agences ANR (Agence Nationale de la Recherche) et DFG (Deutsche
Forschungsgemeinschaft), le laboratoire ICAR (Interactions, Corpus,
Apprentissages, Représentations : http://icar.univ-lyon2.fr) recrute
pour un contrat de 24 mois un ingénieur (IGE / IGR) correspondant au
profil ci-dessous.

POSTE DE DÉVELOPPEMENT D’APPLICATIONS POUR L’EXPLORATION DE CORPUS DU
FRANÇAIS DU 9e AU 21e SIÈCLE AVEC LA PLATEFORME TXM

L’ingénieur recruté participera, en collaboration avec des chercheurs
linguistes et des informaticiens, au développement d’outils
d’exploration de corpus de textes français étiquetés
morpho-syntaxiquement et lemmatisés à partir de la plateforme TXM
(http://textometrie.ens-lyon.fr).

Conditions de candidature
L’appel est ouvert à tout-e candidat-e titulaire d’un diplôme
d’ingénieur, d’un doctorat, d’un master en informatique avec expérience,
ou d’un diplôme équivalent obtenu à l’étranger. Les candidat-e-s sont
invité-e-s à envoyer par courriel un curriculum vitae détaillé ainsi
qu’une lettre de motivation à l’adresse : denis.vigier@univ-lyon2.fr

Conditions d’emploi
La personne recrutée sera salariée de l’École Normale Supérieure de Lyon
sur contrat à durée déterminée de 24 mois. La rémunération mensuelle
nette sera située entre 1560 € et 1980 € selon le niveau de diplôme et
l’expérience du / de la candidat-e (grille de référence des personnels
ingénieurs contractuels de l’ENS Lyon). Le lieu de travail sera l’École
Normale Supérieure de Lyon, site Descartes (Lyon, 7ème arrondissement).

Calendrier
– Date limite de dépôt des candidatures : 15 avril 2013.
Examen des candidatures au fur et à mesure de leur réception
– Décision finale : 30 avril 2013 au plus tard.
– Prise de fonction de la personne recrutée : 15 juin 2013 au plus tard.

Merci de noter que le poste est à pourvoir le plus tôt possible et que
par conséquent, les candidatures seront examinées au fur et à mesure de
leur réception et pourront donner lieu à une décision de recrutement
anticipé par rapport aux dates « butoirs » mentionnées ci-dessus.

Critères de sélection
Les critères de sélection sont : la qualité du dossier du candidat, son
adéquation au profil ainsi que l’apport que représentera la présence du
candidat au sein de l’équipe concernée.

PROFIL DÉTAILLÉ

Contexte
Ce recrutement d’un ingénieur (IGE ou IGR selon le niveau de diplômes et
l’expérience du candidat retenu) par le laboratoire ICAR
(http://icar.univ-lyon2.fr) prend place dans le cadre du projet
franco-allemand PRESTO, co-financé par les organismes ANR (Agence
Nationale de la Recherche) et DFG (Deutsche Forschungsgemeinschaft).
Ce projet a pour but l’étude de l’évolution en diachronie du système
prépositionnel du français. Instrumentée, adossée à une approche
statistique et distributionnelle, cette étude s’appuiera sur un corpus
qui comportera des données étiquetées et lemmatisées. Ce corpus couvrira
la période du 9e s. au 21e s. du français et réunira différents genres
discursifs et types de textes. Elaboré conjointement par les équipes
française et allemande, il s’appuiera en partie sur des ressources déjà
disponibles.
L’outil d’exploration utilisé pour cette étude sera la plateforme TXM
pour l’analyse textométrique de corpus complexes structurés et annotés à
de multiples paliers linguistiques. Initié en 2008 dans le cadre du
projet ANR Textométrie (http://textometrie.ens-lyon.fr), le logiciel TXM
est diffusé en ligne depuis 2009 sous licence open-source
(http://sf.net/projects/txm).

Mission

L’ingénieur recruté participera, en collaboration avec les membres de
l’équipe, au développement du corpus et des outils d’exploration du
projet, comprenant notamment les applications suivantes au sein de la
plateforme TXM :

− étiqueteurs morpho-syntaxiques et lemmatiseurs du français du 9e au
21e siècle ;
− nouveaux traitements d’analyse distributionnelle du lexique ;
− gestionnaire de corpus et ses métadonnées ;
− mise en place d’un portail de diffusion du corpus PRESTO en ligne.

Compétences requises
– Expérience en conception et développement Java open-source : Eclipse
(ou Netbeans), SVN, Javadoc, etc.
– Connaissance approfondie d’un langage de script (Python, Groovy…)
– Traitement XML (DOM/StAX, XSLT 2, CSS 2…)
– Traitement relationnel (SGBDR, JDBC…)

Compétences appréciées
– Développement de lexique morpho-syntaxique « forme – catégorie – lemme
» du français
– Développement d’étiqueteurs morpho-syntaxiques ou de lemmatiseurs
– Développement de packages R
– Frameworks Eclipse RCP ou GWT
– Connaissance de la TEI (P5)

Capacités personnelles
– Bonne maîtrise de l’anglais, oral et écrit
– Bonnes capacités relationnelles et attrait pour le travail d’équipe

Advertisements

Leave a comment

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s