Emploi [stage, 4 à 6 mois] : TAL

[Offre diffusée le 15 février 2014 sur la liste LN]

Stage de Master 2

Paramétrage et évaluation d’un système de classification automatique de rapports de sécurité.

L’entreprise :

CFH (Conseil en facteurs humains)/SafetyDATA est une PME spécialisée
dans le traitement automatique des langues dans le domaine de la
sécurité. Elle travaille en collaboration avec CLLE-ERSS, un laboratoire
de linguistique, et plus particulièrement avec l’équipe TAL (Traitement
automatique des langues). Le stage sera co-encadré par CFH et le
laboratoire CLLE.

Contexte :

CFH a conçu un système de traitement automatique des langues dont le but
est d’analyser des rapports d’incidents afin de proposer une ou
plusieurs catégorie(s) pour leur indexation dans une base de données. Le
système est actuellement déployé et analyse chaque mois plusieurs
centaines de documents (en français et en anglais) à l’aide de règles
apprises automatiquement et basées sur le repérage de certains termes
dans les rapports analysés. Voir plus de détails sur
http://www.safety-data-analysis.com/

Le stage vise l’évolution de ce système de classification, notamment en
envisageant l’utilisation d’un système d’apprentissage supervisé
statistique. L’objectif de ce stage est double :

1/ Identifier et quantifier le gain apporté par l’utilisation d’un
modèle statistique (SVM, régression logistique, réseau bayésien,
etc.) par rapport au système actuel ;

2/ Mesurer l’impact sur les performances du système des différents
traitements linguistiques appliqués aux documents avant leur analyse
(correction des erreurs, normalisation des formes de surface,
identification d’expressions complexes, utilisation de classes
sémantiques, etc.).

Profil recherché :

Étudiant en deuxième année de master ou dernière année d’école
d’ingénieur, en informatique ou traitement automatique des langues.

Compétences requises :

Systèmes de classification automatique par apprentissage
artificiel. L’étudiant doit connaître le fonctionnement de ces systèmes
et être autonome quant à leur utilisation et évaluation (scripts,
gestion de données volumineuses, etc.)
On attend également de l’étudiant une capacité à observer les données et
à s’intégrer dans un environnement interdisciplinaire.

Détails :

– stage conventionné et rémunéré basé à Toulouse
– durée : 4 à 6 mois à partir de mars

Contact :

Céline Raynal raynal@conseil-fh.fr
Ludovic Tanguy tanguy@univ-tlse2.fr

Advertisements