Mediación y selección de fuentes de datos de organizaciones virtuales a gran escala

"DATA SOURCE SELECTION is one of the most critical processes in mediation systems for large-scale contexts, as those found in large virtual organizations. In such contexts, the high volume of structured data sources, distribution, heterogeneity, fragmentation and replication of data hinder the identification of the relevant data sources that should evaluate a query. This thesis provides a comprehensive analysis of current proposals for mediation and for data source selection from the point of view of the requirements of large scale contexts. It contributes a strategy of source selection called OptiSource that combines techniques of information retrieval, combinatorial optimization and semantic technologies to optimize the selection of the most relevant data sources in a large-scale context. OptiSource is part of an adaptable mediation system created for virtual organizations that can dynamically choose the most appropriate source selection strategy according to the context. LA SELECCIÓN DE FUENTES de datos es uno de los procesos más críticos en los sistemas de mediación en contextos de gran escala, como los que se encuentran en las grandes organizaciones virtuales. En tales contextos, el alto volumen de fuentes de datos estructurados, la distribución, la heterogeneidad, la fragmentación y replicación de datos dificultan la identificación de las fuentes de datos relevantes que deben evaluar una consulta. Esta tesis provee un análisis exhaustivo de las propuestas actuales de mediación y de selección de fuentes de datos desde el punto de vista de las exigencias de los contextos a gran escala. Aporta una estrategia de selección de fuentes de datos llamada OptiSource que combina técnicas de recuperación de información, optimización combinatoria y tecnologías semánticas para guiar la selección de las fuentes a aquellas más relevantes en un contexto de gran escala. OptiSource es parte de un sistema de mediación adaptable creado para organizaciones virtuales que elige diná
mediacion-y-seleccion-de-fuentes-de-datos