en fr Semantic Interoperability of Multilingual Lexical Resources as Lexical Linked Data Interopérabilité sémantique multilingue des ressources lexicales en données lexicales liées ouvertes Report as inadecuate




en fr Semantic Interoperability of Multilingual Lexical Resources as Lexical Linked Data Interopérabilité sémantique multilingue des ressources lexicales en données lexicales liées ouvertes - Download this document for free, or read online. Document in PDF available to download.

1 LIG - Laboratoire d-Informatique de Grenoble 2 UGA - Université Grenoble Alpes 3 GETALP - Groupe d’Étude en Traduction Automatique-Traitement Automatisé des Langues et de la Parole LIG - Laboratoire d-Informatique de Grenoble

Abstract : When it comes to the construction of multilingual lexico-semantic resources, the first thing that comes to mind is that the resources we want to align should share the same data model and format representational interoperability. However, with the emergence of standards such as LMF and their implementation and widespread use for the production of resources in the form of lexical linked data Ontolex, representational interoperability has ceased to be a major challenge for the production of large-scale multilingual resources. However, as far as the interoperability of sense-level multilingual alignments is concerned, a major challenge is the choice of a suitable interlingual pivot. Many resources make the choice of using English senses as the pivot e.g. BabelNet, Euro- WordNet, although this choice leads to a loss of contrast between English senses that are lexicalized with different words in other languages. The use of acception-based interlingual representations, a solution proposed over 20 years ago, could be viable. However, the manual construction of such language-independent pivot representations is very difficult due to the lack of expert and algorithms for their automatic constructions have never materialized, mainly because of the lack of a formal axiomatic characterization that ensures the preservation of their correctness properties. In this thesis, we address this issue by first formalizing acception-based interlingual pivot architectures through a set of axiomatic constraints and rules that guarantee their correctness. Then, we propose algorithms for the initial construction and the update of interlingual acception-based multilingual resources by exploiting the combinatorial properties of pairwise bilingual translation graphs. Secondly, we study the practical considerations of applying our construction algorithms on a tangible resource, DBNary a lexical linked data resource extracted from Wiktionary.

Résumé : Lorsqu’il s’agit de la construction de ressources lexico-sémantiques multilingues, la première chose qui vient à l’esprit, est la nécessité que les ressources à aligner partagent le même format de données et la même représentation interopérabilité représentationnelle. Avec l’apparition de standards tels que LMF et leur adaptation au web sémantique pour la production de ressources lexico-sémantiques multilingues en tant que données lexicales liées ouvertes Ontolex, l’interopérabilité représentationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interopérabilité des alignements multilingues, le choix et la construction d’un pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources par exemple BabelNet, EuroWordNet, le choix est fait d’utiliser l’anglais, ou une autre langue, comme pivot interlingue. Ce choix mène à une perte de contraste dans les cas où des sens du pivot ont des lexicalisations différentes dans la même acception dans plusieurs autres langues. L’utilisation d’un pivot à acceptions interlingues, solution proposée il y a déjà plus de 20 ans, pourrait être viable. Néanmoins, leur construction manuelle est trop ardue du fait du manque d’experts et leur construction automatique pose problème du fait de l’absence d’une formalisation et d’une caractérisation axiomatique permettant de garantir leurs propriétés. Nous proposons dans cette thèse de d’abord formaliser l’architecture à pivot interlingue par acceptions, en développant une axiomatisation garantissant leurs propriétés. Nous proposons ensuite des algorithmes de construction initiale automatique en utili- sant les propriétés combinatoires du graphe des alignements bilingues ainsi que des algorithmes de mise à jour. Dans un deuxième temps, nous étudions les implications de l’application de ces algorithmes sur DBNary une ressource en données lexicales liées ouvertes extraite à partir de Wiktionary.

en fr

Keywords : Word-sense alignement multilingual lexical resources lexical linked data semantic interoperability

Mots-clés : Alignement Automatique de sens Ressources lexicales multilingues Interopérabilité sémantique





Author: Andon Tchechmedjiev -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents