Emploi [CDD, 2 ans] : TAL

[Offre diffusée sur la liste RISC]

Profil de poste :
CDD de 24 mois au laboratoire LACITO-CNRS Niveau : Ingénieur d’études

Contribution à la constitution de corpus de langues rares : textes et dictionnaires en ligne

CONTEXTE
Le projet HimalCo, financé par l’Agence Nationale de la Recherche
(2013-2015), porte sur la constitution et l’exploitation de corpus pour dix
langues à tradition orale. Les corpus sont composés de ressources sonores
(enregistrements audio), textuelles (transcription, annotations) ainsi que
de données lexicales (dictionnaires et enregistrements de mots) :
http://himalco.hypotheses.org/

Les corpus et les outils issus du projet HimalCo iront à terme alimenter la
plateforme de la collection Pangloss qui regroupe elle-même plus de 70
corpus de langues rares : http://lacito.vjf.cnrs.fr/archivage/index.htm

MISSIONS
La personne recrutée en CDD travaillera en étroite collaboration avec
l’ingénieur responsable de la Collection Pangloss et participant au projet
HimalCo. Elle devra rapidement faire preuve d’autonomie dans la réalisation
des tâches qui lui sont confiées. Les tâches à effectuer pour le projet sont
diverses. Voici une liste non exhaustive :

traitement et mise en forme des corpus : suivi des tâches, gestion des contacts avec les déposants, alignement texte/son, préparation et vérification de métadonnées…

dépôt de documents à l’archivage pérenne et mise à jour des pages
web correspondantes sur le site de la Collection Pangloss

développement de fonctionnalités en ligne pour la consultation des textes parallèles et des dictionnaires

développement d’outils et mise à jour d’outils existants pour la mise en forme, la diffusion et la recherche dans les corpus

dialogue avec les partenaires de la Collection Pangloss

déploiement d’un outil logiciel de suivi des tâches (de la prise de contact initiale jusqu’au dépôt final) si le temps nécessaire peut être dégagé

COMPETENCES

Connaissances en structuration de données textuelles (HTML, XML, XSL) et sonores (wav).

PHP

Perl

Java souhaité

Capacité d’écoute pour comprendre les besoins et les pratiques des linguistes.

Une expérience de l’étude et/ou du traitement de données linguistiques serait un plus.

DUREE ET DATES
La durée totale du contrat est de 24 mois. Les dates prévues sont : de
novembre 2013 à octobre 2015 inclus. La date de début peut être avancée à
septembre ou octobre 2013 si la personne recrutée le souhaite.
Aucun engagement ne peut être pris concernant une prolongation du contrat
au-delà de 24 mois : les possibilités sont soumises aux contingences des
futurs Appels à projets de recherche (pour les CDD) et des créations de
poste (pour les CDI).

Contact : guillaume [ chez ] vjf.cnrs.fr

Advertisements

Leave a comment

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s