Emploi [stage, ? mois] : TAL

[Offre diffusée le 22 janvier 2014 sur la liste LN]

EXTRACTION D’INFORMATIONS LIÉES AUX CONTROVERSES

contact : Natalia Grabar (natalia.grabar@univ-lille3.fr)

Les méthodes du Traitement Automatique des Langues permettent
d’effectuer plusieurs tâches très coûteuses pour un utilisateur humain,
comme par exemple l’extraction d’information, les questions/réponses,
l’inférence textuelles et la fouille de textes de manière
générale. Cette proposition de stage Master 2 concerne la détection
automatique du risque chimique, qui crée souvent des situations de
controverse.

Le risque chimique couvre les situations où les produits chimiques sont
ou peuvent être dangereux pour la santé humaine, animale et pour
l’environnement. Une des controverses actuelles concerne le risque
chimique lié au bisphénol A et aux phtalates, qui affectent le système
hormonal des individus. Dans les situations de controverse, la détection
d’informations objectives (risque chimique) peut être brouillée par des
informations subjectives propres aux controverses (incertitudes,
opinions, etc.). L’objectif du stage est d’améliorer un système
d’extraction d’information sur le risque chimique existant.

Plus particulièrement, les tâches visées sont les suivantes :

– travailler avec les documents produits dans le domaine de chimie
(chercheurs, institutions…)

– améliorer les ressources linguistiques existantes

– exploiter et améliorer les annotations des documents avec différents
niveaux de spécificité

– ajuster les modèles d’apprentissage automatique

L’ensemble du travail sera effectué en collaboration avec les chercheurs
en traitement automatique de langues (TAL), en risque chimique et en
informatique.

Le stagiaire sera amené à utiliser des outils existants et à développer
ses propres programmes pour mieux analyser et visualiser les données.

Prérequis:

– connaissances en TAL, informatique et linguistique
– manipulation et test des outils de TAL
– habitude de Linux
– capacité de travailler en équipe et individuellement
– lecture et synthèse de la littérature scientifique

Lieu du stage : Lille ou Paris

Le stage est rémunéré.

Selon les résultats du stage, une poursuite en thèse pourrait être
envisagée.

======

UMR CNRS 8163 STL (Savoirs, Textes, Langage), Université Lille 3, est un
laboratoire de recherche multidisciplinaire composé de linguistes,
philologues, philosophes et historiens des sciences. STL se compose
d’une centaine de personnel permanent environ et de nombreux étudiants
en thèse et de master. Les chercheurs et les enseignants-chercheurs du
laboratoire ont participé et participent à de nombreux projets de
recherche financés, nationaux ou européens. La recherche menée en
linguistique est structurée en quatre axes, dont les travaux en
traitement automatique des langues, en lexique et en structure
syntaxique argumentale.

Advertisements