Emploi [stage, 4 mois] : TAL

[Offre diffusée le 1er février 2014 sur la liste LN]

Extraction d’informations sur les pratiques de mobilité

La Direction Innovation et Recherche de la SNCF recherche un stagiaire
pour travailler sur un projet d’étude de la mobilité des voyageurs à
travers l’analyse de données textuelles.

*Activités du stage*

——————————

Réalisation d’une plateforme d’étiquetage sémantique de données
textuelles pour l’analyse des pratiques de mobilité.

*Thème*
——————————

La société connaît depuis quelques années des changements majeurs dans
les pratiques de mobilité, du fait d’autres formes d’organisation du
travail, de l’émergence de nouveaux modes de transport,… Les voyageurs
s’expriment sur le web social à propos leurs déplacements, aussi bien en
situation normale qu’en situation perturbée. Les messages contiennent
des informations sur les activités des voyageurs, leurs particularités
sociologiques ou encore leurs motivations.

Une analyse sémantique en fonction de tels critères est susceptible
d’apporter une meilleure connaissance des comportements, des besoins et
des attentes. Elle permet une compréhension nuancée et différenciée de
la mobilité.

Le stage aura pour objectif de contribuer à la mise en place d’une
plateforme d’analyse de données pour l’extraction d’informations sur les
pratiques de mobilité.

*Description *
——————————

Le stagiaire devra :

– prendre connaissance du contexte du stage (SNCF, Direction Innovation
& Recherche, objectifs du stage et cadre de réalisation, situation
actuelle et interlocuteurs sur les sujets concernés, …)

– faire un état de l’art des outils disponibles sur le marché en
analysant leurs possibilités, leurs avantages et leurs inconvénients.

– mettre en place une interface de gestion de la base de données
(collecte, structuration et interface).

– Définir et implémenter des méthodes pour l’étiquetage sémantique des
données, en fonction d’une typologie qui lui sera préalablement
spécifiée

– Exploiter les résultats d’annotations et proposer des pistes
d’amélioration

Présentations et rapports :

– présentation de début de stage à la SNCF (au bout d’un mois de stage) :
contexte de stage, planning de réalisation et premiers travaux
réalisés.

– rapport final de stage complet comprenant : méthodologie retenue,
travaux réalisés, résultats obtenus et problèmes rencontrés…

2 soutenances de fin de stage : une à l’école et une à la SNCF.
Des présentations en interne SNCF ou externes pourront être effectuées.

*Profil recherché*
——————————

Niveau : De formation Bac+5 en Traitement Automatique du Langage Naturel
ou Informatique (ingénieur ou master 2).

Compétences souhaitées :

– Capacités d’analyse, de rédaction et de synthèse

– Autonomie, qualités relationnelles, qualité de présentation
(orale/écrite).

– Manipulation et test des outils de TAL

– Connaissances en TAL et linguistique

– Bonnes compétences en informatique (programmation, gestion de bases de
données)

– Des connaissances en statistiques seront appréciées.

Bonus :

– Maîtrise d’au moins un langage de programmation (PHP de préférence)
– Maitrise des expressions régulières et du SQL

*Modalités du poste*
——————————

– Durée : 4 mois
– Rémunération prévue: indemnités de stage + carte de circulation SNCF
– Début : à partir de Juin 2014
– Lieu : Paris

Merci d’adresser CV et lettre de motivation à Coralie Reutenauer à
l’adresse mail suivante : coralie.reutenauer@sncf.fr

Advertisements