Observatorio de I+D+i UPM

Memorias de investigación
Communications at congresses:
Integración y Preprocesamiento basado en Ontologías de Repositorios de Datos Biomédicos Distribuidos
Year:2007
Research Areas
  • Artificial intelligence,
  • Programming language
Information
Abstract
Desde la publicación de los resultados del Proyecto Genoma Humano, más de 700 bases de datos públicas y un número mayor de bases de datos privadas ponen a disposición de investigadores y clínicos una cantidad ingente de información ¿ómica¿ y de enfermedades. Este entorno distribuido obliga a crear nuevos métodos avanzados de búsqueda, recuperación, integración y procesamiento de datos, disponibles en bases de datos heterogéneas y accesibles por Internet. Los sistemas clásicos encargados de la integración de bases de datos distribuidas suelen centrarse en la integración a nivel de esquemas, dejando la integración a nivel de instancias a otras herramientas. A pesar de que la relevancia del preprocesamiento e integración de datos ha sido ampliamente reconocida en la literatura científica, se han llevado a cabo relativamente pocos esfuerzos científicos en este campo, comparados con las investigaciones centradas en el desarrollo de nuevos algoritmos de minería de datos. Dentro de los pocos proyectos existentes, actualmente se está imponiendo el enfoque basado en la utilización de ontologías y la Web Semántica. Dichos sistemas ofrecen un marco de trabajo intuitivo para la mejora de la calidad de los datos, facilitando el entendimiento del dominio y suministrando un soporte de conocimiento formal. El trabajo que aquí se expone se centra en el uso de ontologías para la integración a nivel de instancias y preprocesamiento de datos biomédicos en un entorno distribuido. Trabajos previos propios en integración a nivel de esquemas de fuentes biomédicas, de los que parte este trabajo, han demostrado la viabilidad de este enfoque. La integración a nivel de instancias y preprocesamiento de datos se realiza utilizando una ontología de preprocesamiento, desarrollada por los autores, como estructura de soporte formal. Una vez que la información correspondiente a las inconsistencias detectadas en los datos es almacenada en dicha ontología ―proceso supervisado por un experto― los datos pueden ser transformados automáticamente cuando son requeridos por el usuario. El objetivo es ofrecer una interfaz homogénea e intuitiva que permite acceder a datos provenientes de varias fuentes de forma transparente. Finalmente se han llevado a cabo una serie de experimentos realizados con varias bases de datos biomédicas públicas y privadas ―concretamente acerca de perfiles bioquímicos, artritis reumatoide y cáncer de mama.
International
No
Congress
NFORSALUD 2007
960
Place
Madrid (España)
Reviewers
Si
ISBN/ISSN
Start Date
06/03/2007
End Date
08/03/2007
From page
To page
Participants
  • Participante: A Anguita
  • Participante: A Silva
  • Autor: Guillermo De la Calle Velasco (UPM)
  • Autor: David Perez Del Rey (UPM)
  • Autor: Jose Crespo Del Arco (UPM)
  • Participante: L Martín
  • Autor: Victor Manuel Maojo Garcia (UPM)
  • Autor: Miguel Garcia Remesal (UPM)
  • Participante: A Rodríguez-Patón
  • Autor: Jose Maria Barreiro Sorrivas (UPM)
Research Group, Departaments and Institutes related
  • Creador: Grupo de Investigación: Grupo de Informática Biomédica (LIA)
  • Departamento: Inteligencia Artificial
  • Departamento: Lenguajes y Sistemas Informáticos e Ingeniería de Software
S2i 2019 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)