en fr Integration and Matching processes for geographic databases; application to road-network multi-scale databases Processus dintégration et dappariement de Bases de Données Géographiques; Application à une base de donnéesReport as inadecuate




en fr Integration and Matching processes for geographic databases; application to road-network multi-scale databases Processus dintégration et dappariement de Bases de Données Géographiques; Application à une base de données - Download this document for free, or read online. Document in PDF available to download.

1 COGIT IGN - Conception Objet et Généralisation de l-Information Topographique

Abstract : Phenomena of the real world are described in a variety of forms in current geographic data bases GDBs : geographic data models, users- points of view, systems are different. Concurrently re-using GDBs thus requires an integration process both to eliminate duplicates and to regroup complements. Integration makes it possible to federate data from different sources while cutting down acquisition costs new data captures are avoided ; it is a crucial issue for interoperability between GDBs.After integration, several representations of real world phenomena are available, with distinct points of view and at different scales. These multiple representations are useful and even necessary for a wide range of applications, such as multi-scale cartography, update propagation, aided navigation etc.The aim of the thesis is to devise an integration process on 2-D, vector data of a single-site GDB. It is modelled as an extended classical three-stepped integration process schema preparation, investigation for correspondences, integration Spaccapietra et al. 92. The extension involves a taxonomy of integration conflicts between GDBs and a process for joint geometric - topologic data matching. The integration process has been applied from IGN-s three main data bases BD TOPO®, BD CARTO® and GEOROUTE® on the Lagny area 900 km of roads network.Given the complexity of the real world-s phenomena, several versions and as many models may be defined. The differences are structured in the taxonomy of integration conflicts : conflicts come as definition conflicts classification conflicts, fragmentation conflicts, specification conflicts, heterogeneity conflicts, description conflicts

. Altogether, six conflict categories have been used for the integration process.Some conflicts are taken into account at the stage of schema preparation. Other conflicts require specific treatment : extension of the language of correspondence declarations and operations to solve the conflicts. Indeed, integration requires a strategy. The strategy makes the choice of operations to perform and fixes the goal of the integration process. For the databases of the experiments, two strategies and their associated operations are shown.The data matching process consists in identifying sets of data representing the same real world phenomenon and allows to regroup data. This step is precious for it enhances GDBs with inter-representation operations that are useful for multi-representation applications.A data matching process has been developed for road data at different scales, with 90% of the results correct. Henceforth, a generic process has been inferred to help designing matching processes on other kinds of data.The thesis, describing a generic and detailed framework for the integration of GDBs, contributes to the development not only of multi-representation applications but also of interoperability between GDBs , once the processes are adapted to network distributed GDBs.

Résumé : Les phénomènes du monde réel sont actuellement représentés dans les Bases de Données Géographiques BDG sous différentes formes suivant les modèles géographiques, suivant les points de vue utilisateur et-ou suivant les systèmes. La réutilisation de telles BDG nécessite dès lors un processus d-intégration pour éliminer les parties redondantes et regrouper les parties complémentaires. Ce processus d-intégration est nécessaire étant donné le coût d-acquisition des données géographiques de cette manière des saisies d-information sont évitées et permet de fédérer l-information provenant de différentes sources. L-intégration est donc au cœur du problème d-interopérabilité entre BDG.A l-issue de celle-ci, plusieurs représentations de phénomènes du monde réel sont disponibles selon des points de vue différents et des échelles distinctes. Ces représentations multiples sont nécessaires pour des applications très diverses : cartographie électronique multi-échelle, propagation des mises à jour, aide à la navigation.L-objectif de cette thèse consiste donc à définir un processus d-intégration de BDG sur un seul site, le processus étant limité aux données en mode vecteur à deux dimensions. Il propose l-extension d-un processus d-intégration classique à trois phases Spaccapietra et al. 92 pré-intégration, déclaration des correspondances, intégration. L-extension est fondée sur une taxonomie des conflits d-intégration entre BDG et sur l-ajout d-un processus d-appariement géométrique et topologique. Ce processus a été mis en œuvre sur les trois principales bases de données de l-IGN BD TOPO®, BD CARTO® et GEOROUTE® pour le thème routier dans la région de Lagny environ 900 km de tronçons routiers.Etant donnée la complexité des phénomènes géographiques, plusieurs interprétations et donc plusieurs modélisations des phénomènes peuvent être définies. La taxonomie des conflits d-intégration de BDG effectue une structuration de ces différences : conflits de définition de classe conflits de classification, conflits de fragmentation, conflits de spécification, conflits d-hétérogénéité, conflit de description,

.Six catégories de conflits ont été traitées dans le processus d-intégration.Certains conflits sont pris en compte dans la phase de pré-intégration. D-autres font l-objet d-un traitement spécifique : extension du langage de déclaration des correspondances, ajout d-opérations de résolution de ce conflit. De plus, la phase d-intégration doit suivre une stratégie. Cette stratégie détermine le choix des opérations et fixe l-objectif de l-intégration. Au vu de nos bases d-expérimentations, deux stratégies d-intégration et leurs opérations d-intégration associées sont présentées.Le processus d-appariement consiste à identifier les données représentant le même phénomène du monde réel et permet le regroupement d-informations. Cette étape est précieuse car elle enrichit les BDG d-opérations inter-représentations, opérations nécessaires aux applications multi-représentations.Un processus d-appariement a été développé pour les données de types routières à différentes échelles. Les résultats obtenus font apparaître un taux de correspondance de l-ordre de 90 %. Un processus générique en a été déduit afin de guider la conception des processus d-appariement concernant d-autres types de données.Cette thèse apporte donc un cadre général et détaillé pour les intégrations de BDG et contribue ainsi à l-essor d-applications multi-représentations et de l-interopérabilité entre les BDG en adaptant ces processus à des BDG réparties sur un réseau.

en fr

Keywords : geographic database geographic information system data matching multi-representation multi-scale integration conflict interoperability reusing

Mots-clés : réutilisation base de données géographiques système d-information géographique intégration appariement multi-représentations multi-échelles conflit d-intégration interopérabilité réutilisation.





Author: Thomas Devogele -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents