Une approche matérialisée basée sur les vues pour l'intégration de documents XML. (A view-based approach to the integration of structured and semi-structured data)
نویسنده
چکیده
Semi-structured data play an increasing role in the development of the Web through the useof XML. However, the management of semi-structured data poses speci c problems because semi-structured data, contrary to classical databases, do not rely on a prede ned schema. The schemaof a document is contained in the document itself and similar documents may be represented bydi erent schemas. Consequently, the techniques and algorithms used for querying or integratingthis data are more complex than those used for structured data.The objective of our work is the integration of XML data by using the principles of Osiris,a prototype of KB-DBMS, in which views are a central concept. In this system, a family ofobjects is de ned by a hierarchy of views, where a view is de ned by its parent views and itsown attributes and constraints. Osiris belongs to the family of Description Logics ; the minimalview of a family of objects is assimilated to a primitive concept and its other views to de nedconcepts. An object of a family satis es some of its views. For each family of objects, Osirisbuilds a n-dimensional classi cation space by analysing the constraints de ned in all of its views.This space is used for object classi cation and indexation.In this thesis we study the contribution of the main features of Osiris classi cation, index-ation and semantic query optimization to the integration of XML documents. For this purposewe produce a target schema (an abstract XML schema), which represents an Osiris schema ;every document satisfying a source schema (concrete XML schema) is rewritten in terms of thetarget schema before undergoing the extraction of the values of its entities. The objects corre-sponding to these entities are then classi ed and indexed. The Osiris mechanism for semanticquery optimization can then be used to extract the objects of interest of a query.We have realized a prototype, named OSIX (Osiris-based System for the Integration of XMLdocuments) and we have applied it to the integration and interrogation of XML documentssimulating the data of a hospital.
منابع مشابه
Intégration de données environnementales : une approche basée sur les entrepôts de documents XML et les ontologies
Résumé. Cet article présente l’approche que nous avons adoptée pour résoudre le problème d’intégration de données dans le contexte du projet SIC-Sénégal dont l‘objectif est de permettre à plusieurs organismes partenaires de partager leurs sources de données environnementales. Nous réalisons une intégration en deux phases. Une première phase d’intégration structurelle, basée sur l’utilisation d’...
متن کاملIntégration de règles d'association pour améliorer la recherche d'informations XML
RÉSUMÉ. La reformulation de requêtes constitue un moyen d’améliorer la recherche d’informations, en particulier lorsque cela concerne des documents XML. Les approches existantes se basent sur une connaissance du domaine (thésaurus, ontologie) pour étendre la requête initiale. Nous proposons une approche de reformulation automatique basée sur une technique de datamining. Nous intégrons les règle...
متن کاملMaterialized views for P2P XML warehousing
Nous abordons la gestion efficace de documents XML dans un réseau pair à pair structuré, basé sur une table de hachage distribuée. Nous présentons une approche permettant d’exploiter des vues matérialisées déployées indépendamment sur le DHT par les pairs. Ces vues sont utilisées pour répondre à des requêtes de motifs d’arbes XML. Nous proposons des algorithmes pour la maintenance distribuée de...
متن کاملA General Approach for Securely Querying and Updating XML Data
Over the past years several works have proposed access control models for XML data where only read-access rights over non-recursive DTDs are considered. A few amount of works have studied the access rights for updates. In this paper, we present a general model for specifying access control on XML data in the presence of update operations of W3C XQuery Update Facility. Our approach for enforcing...
متن کاملF-CheX : Une approche de fouille dans les documents XML
Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2009