Observatorio de I+D+i UPM

Memorias de investigación
Capítulo de libro:
Text Analysis and Information Extraction from Spanish Written Documents
Año:2014
Áreas de investigación
  • Interfases mediante lenguaje natural
Datos
Descripción
Despite of the spread of Electronic Health Records (EHRs) in Spanish hospitals and Spanish occupying the second place in the ranking of number of speakers, to the best of our knowledge there are no natural language processing tools for medical texts written in Spanish. This paper presents an approach based on OpenNLP to process natural language texts written in Spanish for information extraction. The main goal is to integrate our development with cTAKES. As cTAKES has been specifically trained for the clinical domain, in this paper we will train the main modules from a general purpose annotated Spanish corpus and an in-house corpus developed with medical documents, testing both on a set of medical documents. Best performance of individual components when tested with medical documents: Sentence boundary detector accuracy = 0.872; Part-of-speech tagger accuracy = 0.946; chunker = 0.909.
Internacional
Si
DOI
10.1007/978-3-319-09891-3_18
Edición del Libro
1
Editorial del Libro
Springer Link
ISBN
978-3-319-09890-6
Serie
Lecture Notes in Computer Science
Título del Libro
Brain Informatics and Health
Desde página
188
Hasta página
197
Esta actividad pertenece a memorias de investigación
Participantes
  • Autor: Roberto Costumero Moreno (UPM)
  • Autor: Angel Mario García Pedrero (UPM)
  • Autor: Consuelo Gonzalo Martin (UPM)
  • Autor: Ernestina Menasalvas Ruiz (UPM)
  • Autor: Socorro Millán
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Minería de Datos y Simulación (MIDAS)
  • Departamento: Lenguajes y Sistemas Informáticos e Ingeniería de Software
  • Departamento: Arquitectura y Tecnología de Sistemas Informáticos
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)