Emploi [CDI] : TAL

[Offre diffusée le 22 novembre 2013 sur la liste linguistlist par NetBase Solutions]

Computational Linguist

University or Organization: NetBase Solutions
Department: Engineering/NLP
Job Location: Heidelberg, Germany
Web Address: http://www.netbase.com
Job Rank: Computational Linguist

Specialty Areas: Computational Linguistics; Lexicography; Syntax; Natural Language Processing

Required Language(s): Spanish (spa)

Description:

We are seeking a Spanish-speaking computational linguist to be part of our NLP development team. The main responsibility will be to further enhance our insight extraction system for social-media contents in Spanish. This is an integrated part of a team effort for our multilingual program primarily based on grammars and rules to support the extraction of consumer sentiments and opinions about brands and products. The position can be based in Heidelberg, Germany, or Mountain View, California.

Responsibilities:
– Develop and maintain morphosyntactic and semantic lexicons for Spanish NLP, in particular sentiment extraction, with a special focus on internet jargon and slang
– Enhance an FST-based dependency grammar for Spanish as well as modules for the correction of the PoS-tagger/lemmatizer output
– Enhance dependency-based graph grammars for sentiment extraction and other information-extraction tasks
– Design, build and unit-test software in a collaborative environment
– Conduct code review

Requirements:
– MA or PhD in Computational Linguistics or a related field
– 4+ years of work experience as a software engineer
– (Near-)Native fluency in Spanish
– Experience in development and deployment of Natural Language Processing software
– Experience using a scripting language such as Python
– Familiarity with development and debugging in a software development environment
– Strong problem solving, critical thinking, and algorithm skills
– Passion for developing efficient, testable and well-documented code
– Authorization to work in Germany or the US and willingness to relocate

Desirable Skills:
– Experience with developing computational grammars and/or lexicons
– Experience with Java programming
– Agile development methodologies
– Machine learning on sentiment analysis and topic clustering
– Polyglot a plus

Benefits of working at NetBase include:
– Competitive compensation and benefits package, and equity
– Mac, Windows, or Linux laptop of your choice
– Colleagues who are some of the smartest engineers and tech entrepreneurs
– Open, collaborative environment
– Telecommuting option
– Opportunity to work with what our Fortune 100 customers say is the best, most-scalable natural language platform in existence

For more information, please visit the application URL below.

Application Deadline:  (Open until filled)

Email Address for Applications: team@netbase.com
Web Address for Applications: http://www.netbase.com/job-posting/computational-linguist-spanish/
Contact Information:
Dr. Martin Forst
Email: mforst@netbase.com

Advertisements

Emploi [stage, 6 mois] : TAL

[Offre diffusée sur la liste LN le 5 novembre 2013 par Syllabs]

Offre de stage M2 en TAL à Syllabs (Paris)

Caractérisation des objets touristiques pour l’extraction de facettes
dans le tourisme

 

Syllabs travaille depuis un certain temps sur des outils de TAL
appliqués au tourisme, que ce soit dans un contexte de web mining, de
text mining ou de production de contenus.Dans le cadre de Tourinflux,
projet de recherche multi-partenaire en cours, Syllabs doit produire des
bases de connaissances se rapportant à des objets touristiques (hôtels,
etc.). Ce projet vise à apporter aux acteurs du tourisme (d’abord les
institutionnels mais aussi les acteurs privés) un ensemble d’outils leur
permettant de gérer à la fois leurs données internes et les informations
disponibles sur le web afin de mieux comprendre comment un territoire
est perçu et de mieux agir sur cette perception. C’est dans ce contexte
que se situe le stage. Celui-ci comporte plusieurs étapes et
objectifs. La durée du stage ne permettra peut-être pas de tout couvrir.

—————————-
Descriptif du stage
—————————-

1) Modélisation d’une base de connaissances des objets touristiques

– Créer une taxonomie (simple) des différents objets touristiques et
 étudier les facettes communes à plusieurs objets.

– Déterminer les facettes utilisables pour la génération automatique des
 descriptifs

– Déterminer les facettes nécessaires pour l’analyse d’avis
 d’internautes

2) Extraction des facettes via LOL (outil dédié à base de règles
  linguistiques)

– Extraction des facettes présents dans les “descriptifs marchands”

– Extraction des facettes présents dans les “avis internautes”

3) Création de la base à partir de la sortie d’extraction

– Créer une base de données à partir de la sortie d’extraction,
 manipulation des objets extraits

4) Génération de descriptifs d’objets touristiques

– écrire des règles de génération pour 2 objets touristiques différents
 en fonction de la base obtenue

————————
 Profil souhaité
————————

– Aptitude pour la représentation formelle du langage.

– Excellente capacité de communication et aptitude pour le travail
 d’équipe.

– Bon niveau en python serait un plus.

– Excellentes qualités rédactionnelles, goût pour l’écriture.

Formation en cours : Linguistique Informatique, TAL ou similaire.

Durée du stage : 6 mois (début entre janvier et avril, en fonction du
cursus universitaire)

Merci d’envoyer votre candidature à l’adresse jobs@syllabs.com en
indiquant dans l’objet du mél « Stage TAL ».

Lieu : Syllabs, 26 rue Notre Dame de Nazareth, 75003 Paris.

Contrat : stage conventionné rémunéré en fonction du niveau d’étude.

Emploi [CDI] : TAL

[Offre diffusée sur la liste linguistlist le 27 octobre 2013 par Systran]

Computational Linguist

University or Organization: SYSTRAN Software, Inc.
Department: Linguistics
Job Location: California, USA
Web Address: http://www.systransoft.com/
Job Title: Computational Linguist
Job Rank: Computational Linguist

Specialty Areas: Computational Linguistics; Morphology; Text/Corpus Linguistics

Required Language(s): Russian (rus)
Urdu (urd)

Description:

We are currently seeking an experienced Russian-speaking Computational Linguist to join our R&D team in San Diego.

The ideal candidate must have a combination of research and implementation skills, including significant programming experience. Strong experience with machine learning, rule-based and statistical machine translation, part-of-speech tagging, text analytics, sentiment analysis, named entity recognition, deep learning for NLP, or a related field is highly desirable.

Essential duties and responsibilities include the following:
– Software development
– Experimentation and analysis of experimental results
– Building systems that combine linguistics and statistical language models for machine translation covering several languages

Education and/or Experience:
– MS in Computational Linguistics or relevant field
– 3+ years work experience

Skills:
– Strong background in statistical modeling required.
– Experience creating Statistical Machine Translation systems using bilingual corpora.
– A combination of research and implementation skills.
– Significant programming experience in C++.
– An exceptional individual interested in transforming the capabilities of machine translation systems.
– Fluent in English.
– Solid background in linguistics.
– Evidence of mature, flexible, and innovative approaches in previous work experience.
– Strong communication skills and ability to work in a team

Language requirements:
– Native speaker of the Russian language.
– Fluent in English

Application Deadline:  (Open until filled)

Email Address for Applications: jobs-depot@systran.fr
Contact Information:
Mr. John Dimm
Email: dimm@systransoft.com