Memorias de investigación
Otros meritos:
Segmentación música-habla y detección de tópico para un sistema de recuperación de información basado en habla. (Music-speech segmentation and topic detection for a speech-based information retrieval system)
Año:2011

Áreas de investigación
  • Tecnología electrónica y de las comunicaciones,
  • Ingeniería eléctrica, electrónica y automática

Datos
Descripción
En este trabajo se abordan dos estrategias, la segmentación de audio y la detección de temática; las cuales son paralelas a los sistemas de reconocimiento de habla, y permiten aportar mejoras en las tasas de reconocimiento y a la vez entregar información contextual acerca de la temática o del tópico que se está tratando. Por un lado, la segmentación de audio juega un rol importante como etapa previa de sistemas más complejos de recuperación de información, en cuanto permite discriminar el tipo de contenido y procesar así sólo las tramas de habla "útil". Esto es fundamental en tareas de anotación e indexado de corpus de gran tamaño y como se estudia en este trabajo, es importante en el momento de procesar ficheros de audio con contenido mixto, es decir, con segmentos de música, habla más música o ruidos de fondo. Para un sistema de reconocimiento automático de habla (RAH), reconocer todas las tramas de un fichero de contenido mixto podría producir altas tasas de error. Por tanto, uno de los retos en el desarrollo de sistemas de reconocimiento automático de habla para contenidos multimedia radica en cómo separar las señales de voz del resto de señales contenidas en los registros con el fin de evitar el procesamiento de tramas "mixtas" o de tramas que no contengan información relevante. Por otro lado y tal como se mencionó anteriormente, la otra estrategia que se estudia en este trabajo es la detección de la temática asociada a un texto que ha sido reconocido por un sistema de RAH o que bien está siendo analizado como parte de un corpus. Esta tarea consiste en asociar cada nueva entrada a una temática previamente etiquetada, o dicho de otra manera, de identificar historias relacionadas entre sí. Actualmente la detección de tópico puede ser empleada no sólo para el indexado de contenidos sino también para la selección de modelos de lenguaje que permitan al sistema de reconocimiento automático de habla adaptarse mejor a las condiciones de la entrada.
Internacional
No
Comentarios Mérito
Trabajo fin de master. Tutor: José Manuel Pardo

Esta actividad pertenece a memorias de investigación

Participantes
  • Autor: Julian David Echeverry Correa UPM

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Tecnología del Habla
  • Departamento: Ingeniería Electrónica