Memorias de investigación
Estancias o Sabáticos:
NUEVA METODOLOGÍA PARA LA INTEGRACIÓN DE RASGOS BIOMÉTRICOS EN SISTEMAS DE IDENTIFICACIÓN DE LOCUTOR EN ENTORNOS DE SEGURIDAD
Año:2007

Áreas de investigación
  • Procesado y análisis de la señal

Datos
Descripción
Los objetivos que se pretendían cubrir por el solicitante durante su estancia en la Univesidad de Maryland, consistían en el desarrollo y depuración de un sistema que permitiera la separación, a partir de la señal de voz original, de la estimación del pulso glótico y la estimación del tracto vocal para su utilización en un sistema de reconocimiento de locutor que permitiera mejorar las tasas de reconocimiento ofrecidas por sistemas de reconocimiento basados en parámetros clásicos , según el desglose de actividades presentado en el plan de formación de la solicitud. Para la consecución de este objetivo, se llevaron a cabo las siguientes actividades: ¿ Desarrollo y depuración de un algoritmo que permite la separación a partir de la señal de voz original, de la estimación del pulso glótico y de la estimación del tracto vocal. ¿ Integración de dicho algoritmo en una aplicación que permite la extracción a partir de la señal de voz original, de diferentes tipos de parámetros de la voz, tanto clásicos (es decir, MFCC) como biométricos (es decir, los nuevos parámetros obtenidos a partir de la estimación de pulso glótico y de la estimación del tracto vocal). Parámetros que pueden ser utilizados posteriormente en tareas de reconocimiento. ¿ Diseño de un plataforma que permita el tratamiento automatizado de una base de datos con gran capacidad contrastiva, como es ALBAYZIN. ¿ Tratamiento de la base de datos ALBAYZIN, utilizando diferentes parámetros clásicos y diferentes tiempos de entrenamiento para establecer un punto de referencia que permita contrastar el rendimiento de dichos parámetros clásicos con los nuevos parámetros. ¿ Tratamiento de la base de datos ALBAYZIN, utilizando diferentes parámetros biométricos y diferentes tiempos de entrenamiento. ¿ Análisis de los resultados obtenidos en ambos casos. ¿ Búsqueda de métodos de fusión que permitan mejorar las tasas de reconocimiento de locutor en base a la utilización de parámetros clásicos y los nuevos parámetros biométricos. ¿ Estudio y desarrollo de un sistema de clasificación basado en SVMs (Support Vector Machines), para contrastar los resultados obtenidos mediante el sistema de clasificación basado en GMMs (Guassian Mixture Models). (En fase de pruebas)
Internacional
Si
Lugar
University of Maryland
Tipo
Miembros en el extranjero
Fecha inicio
01/03/2007
Fecha fin
30/06/2007

Esta actividad pertenece a memorias de investigación

Participantes

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Informática Aplicada al Procesado de Señal e Imagen
  • Departamento: Arquitectura y Tecnología de Sistemas Informáticos