Emploi [CDD, 6 mois] : linguistique

[Offre diffusée le 4 décembre 2013 sur la liste ParisLinguist]

Ingénieur d’étude – Annotation Corpus AV et sonore

Contact : M.Caterina Manes Gallo (Pr)
Email : maria-caterina.manes-gallo@u-bordeaux3.fr
Laboratoire : TELEM EA 4195

Date de début du contrat : Janvier 2014

Durée du contrat : 6 mois

Financement : Région Aquitaine dans le cadre du projet interdisciplinaire ACORSENS (Anonymisation CORpus SENsibleS)

Profil du/de la candidat/e :
La ou le candidat(e) doit avoir acquis une compétence dans la transcription de corpus multi-modaux, dans le cadre d’un travail de thèse doctorale. Cette compétence doit s’appuyer sur une familiarité avec un logiciel de transcription pour l’analyse de la parole (e.g. Pratt, Winpitch, ELAN, …).
Une aptitude et/ou une motivation à travailler en collaboration avec des chercheurs en informatique, spécialisés dans le traitement de l’image et du son sont bienvenues.

Démarche de candidature :  
Veuillez envoyer avant le  20 décembre 2013 : un CV (1 page maximum) et un résumé de la thèse de doctorat.

Tâches à réaliser dans le cadre du contrat d’IE:
Le travail de transcription s’inscrit dans un projet qui a pour objectif l’anonymisation de corpus, dits « sensibles », i.e. recueillis in situ dans des milieux difficilement accessibles. Dans notre cas il s’agit d’un corpus audio-visuel et audio, recueilli à la Cyber base®justice du Centre Pénitentiaire de Gradignan.

Le corpus comprend 27heures d’enregistrement audio-visuels et  3heures d’enregistrement sonore. Les conventions de transcription seront établies en collaboration avec les chercheurs qui participent au projet ACORSenS.

Les enregistrements audio-visuels comprennent deux parties. Une première partie concerne les activités d’enseignement et d’apprentissage effectuées dans les différents ateliers de la Cyber base®justice (i.e. un espace pédagogique « outilllé » finalisé au développement de la compétence « numérique » de détenus en fin de peine).
Une seconde partie, comprend les entretiens avec les différents acteurs qui participent au fonctionnement de la Cyberbase (détenus, formateurs). Enfin,  le corpus sonore concerne les entretiens avec les surveillants et le chef de détention.
L’ensemble du corpus a déjà été segmenté (séquences entre 6’ et 16’) qui  ont ensuite été catégorisées selon les types d’interaction mise en œuvre dans les activités ou les thèmes mobilisés dans les entretiens.

Advertisements