en fr Shared memories of bilingual subsentential alignments Mémoires partagées dalignements sous-phrastiques bilingues Report as inadecuate




en fr Shared memories of bilingual subsentential alignments Mémoires partagées dalignements sous-phrastiques bilingues - Download this document for free, or read online. Document in PDF available to download.

1 TEXTE - Exploration et exploitation de données textuelles LIRMM - Laboratoire d-Informatique de Robotique et de Microélectronique de Montpellier

Abstract : This research belongs to the Natural Language Processing NLP field and more specifically focuses on the topic of Sub-sentential Alignments which is closely related to Machine Translation. The originality of this work consists in an example-based approach bootstrapped by the participation of non-expert annotators through an appropriate interface. The quest for a greater expressivity, such as observed in manual alignments, mainly motivates the whole approach. An important effort has been made to define a formal environment for this original architecture based on aligned examples. Several memories have been created, using syntactic informations from parsers outputs with reasonnable low-tech requirements. Two new alignment methods were compared with state-of-theart measures and three transformational metrics were introduced

Résumé : Cette thèse s-inscrit dans le cadre du traitement automatique du langage naturel, et traite plus précisément de l-alignement sous-phrastique bilingue classiquement lié à la traduction automatique statistique. Les travaux exposés s-en distinguent en proposant un fonctionnement évolutif à base d-exemples initialisé par des annotateurs non-experts via une interface adaptée. L-approche est principalement motivée par la recherche d-une expressivité comparable à celle observée dans les alignements manuels. Une partie importante de ce travail consiste à définir un cadre formel sous-tendant une architecture originale à base d-exemples alignés. Plusieurs mémoires d-alignements ont été constituées en tirant parti d-informations provenant d-analyseurs syntaxiques automatiques, en plaçant les prérequis technologiques à un niveau raisonnablement peu élevé. Deux nouvelles méthodes d-alignement sont comparées à des références connues via des mesures d-accord classiques, et trois distances transformationnelles sont introduites.

en fr

Keywords : Sub-sentential Alignement golden corpus expressivity human-machine interface

Mots-clés : Alignement sous-phrastique corpus de référence divergence expressivité annotation interface homme-machine





Author: Johan Segura -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents