Memorias de investigación
Ponencias en congresos:
Integración y Preprocesamiento basado en Ontologías de Repositorios de Datos Biomédicos Distribuidos
Año:2007

Áreas de investigación
  • Inteligencia artificial,
  • Lenguaje de programación

Datos
Descripción
Desde la publicación de los resultados del Proyecto Genoma Humano, más de 700 bases de datos públicas y un número mayor de bases de datos privadas ponen a disposición de investigadores y clínicos una cantidad ingente de información ¿ómica¿ y de enfermedades. Este entorno distribuido obliga a crear nuevos métodos avanzados de búsqueda, recuperación, integración y procesamiento de datos, disponibles en bases de datos heterogéneas y accesibles por Internet. Los sistemas clásicos encargados de la integración de bases de datos distribuidas suelen centrarse en la integración a nivel de esquemas, dejando la integración a nivel de instancias a otras herramientas. A pesar de que la relevancia del preprocesamiento e integración de datos ha sido ampliamente reconocida en la literatura científica, se han llevado a cabo relativamente pocos esfuerzos científicos en este campo, comparados con las investigaciones centradas en el desarrollo de nuevos algoritmos de minería de datos. Dentro de los pocos proyectos existentes, actualmente se está imponiendo el enfoque basado en la utilización de ontologías y la Web Semántica. Dichos sistemas ofrecen un marco de trabajo intuitivo para la mejora de la calidad de los datos, facilitando el entendimiento del dominio y suministrando un soporte de conocimiento formal. El trabajo que aquí se expone se centra en el uso de ontologías para la integración a nivel de instancias y preprocesamiento de datos biomédicos en un entorno distribuido. Trabajos previos propios en integración a nivel de esquemas de fuentes biomédicas, de los que parte este trabajo, han demostrado la viabilidad de este enfoque. La integración a nivel de instancias y preprocesamiento de datos se realiza utilizando una ontología de preprocesamiento, desarrollada por los autores, como estructura de soporte formal. Una vez que la información correspondiente a las inconsistencias detectadas en los datos es almacenada en dicha ontología ―proceso supervisado por un experto― los datos pueden ser transformados automáticamente cuando son requeridos por el usuario. El objetivo es ofrecer una interfaz homogénea e intuitiva que permite acceder a datos provenientes de varias fuentes de forma transparente. Finalmente se han llevado a cabo una serie de experimentos realizados con varias bases de datos biomédicas públicas y privadas ―concretamente acerca de perfiles bioquímicos, artritis reumatoide y cáncer de mama.
Internacional
No
Nombre congreso
NFORSALUD 2007
Tipo de participación
960
Lugar del congreso
Madrid (España)
Revisores
Si
ISBN o ISSN
DOI
Fecha inicio congreso
06/03/2007
Fecha fin congreso
08/03/2007
Desde la página
Hasta la página
Título de las actas

Esta actividad pertenece a memorias de investigación

Participantes

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Informática Biomédica (LIA)
  • Departamento: Inteligencia Artificial
  • Departamento: Lenguajes y Sistemas Informáticos e Ingeniería de Software