Emploi [stage, ? mois] : TAL

[Offre diffusée le 22 janvier 2014 sur la liste LN]

Compréhension de texte et réponse à des questions

Problématique

La compréhension automatique de texte repose sur les capacités de la machine de disposer de connaissances et les mettre en oeuvre pour réaliser des raisonnements.  Ces connaissances  sont naturellement disponibles dans des textes, et le problème consiste à les rendre exploitables  afin de permettre d’étendre les capacités d’inférence de la machine. Ainsi, si l’on prends une tâche de réponse à des questions sur un texte, la machine ne se limitera pas à extraire des réponses de ce texte, mais sera en mesure de faire collaborer et réaliser des inférences à partir d’informations issues de textes différents.
Le stage s’inscrit dans cette problématique, et plus particulièrement dans le cadre de l’évaluation QA4MRE qui consiste à répondre à un QCM et choisir une réponse parmi plusieurs proposées.

Sujet

A partir du système de question-réponse (QAVAL), qui repose sur un module de validation de réponses pour choisir la réponse à une question, le but sera d’étudier dans quelle mesure la stratégie mise en oeuvre pour la validation de réponses peut constituer le coeur d’un module d’inférences. En effet ce module repose sur un apprentissage qui permet de combiner un ensemble d’éléments extraits de passages de textes et constituant des critères constribuant à déterminer la réponse correcte. Il s’agira donc d’étudier les types de connaissances requises pour choisir la réponse correcte aux différentes questions posées et les types d’inférences à réaliser et leur modélisation. Celles-ci peuvent aller de simples reformulations à des chaines d’inférences (causales ou temporelles) combinant reformulations et reconnaissance de relations entre entités.

Les corpus  fournis sont des textes en anglais qui concernent des domaines de spécialités. Un accent particulier sera mis sur des textes scientifiques en biomédical, et le but du stage sera aussi d’étudier en quelle mesure les travaux du groupe en extraction de relations entre entités médicales peuvent aider à réaliser des inférences.

Références

Arnaud Grappy, Brigitte Grau, Mathieu-Henri Falco, Anne-Laure Ligozat, Isabelle Robba, Anne Vilnat, Selecting answers to questions from Web documents by a robust validation process, IEEE/WIC/ACM International Conference on Web Intelligence, 2011
Anne-Lyse Minard, Ligozat Anne-Laure and Grau Brigitte, Multi-class SVM for relation extraction from clinical reports, RANLP, 2011
Partha Pakray, A Hybrid Question Answering System based on Information Retrieval and Answer ValidationCLEF 2011, QA4MRE Workshop, 2011

Prérequis

Stage de M2R ou 3ème année ingénieur
Connaissances en TAL, bonnes connaissances en informatique

Lieu et encadrement

Laboratoire : LIMSI, Orsay
Responsables :
Brigitte Grau, Professeur, Groupe ILES, LIMSI
Anne-Laure Ligozat, Maître de conférences, Groupe ILES, LIMSI

URL de l’offre : http://perso.limsi.fr/Individu/bg/pageWebPHP/stage_QA4MRE.php

Advertisements