Observatorio de I+D+i UPM

Memorias de investigación
Stays or Sabbaticals:
NUEVA METODOLOGÍA PARA LA INTEGRACIÓN DE RASGOS BIOMÉTRICOS EN SISTEMAS DE IDENTIFICACIÓN DE LOCUTOR EN ENTORNOS DE SEGURIDAD
Year:2007
Research Areas
  • Processing and signal analysis
Information
Abstract
Los objetivos que se pretendían cubrir por el solicitante durante su estancia en la Univesidad de Maryland, consistían en el desarrollo y depuración de un sistema que permitiera la separación, a partir de la señal de voz original, de la estimación del pulso glótico y la estimación del tracto vocal para su utilización en un sistema de reconocimiento de locutor que permitiera mejorar las tasas de reconocimiento ofrecidas por sistemas de reconocimiento basados en parámetros clásicos , según el desglose de actividades presentado en el plan de formación de la solicitud. Para la consecución de este objetivo, se llevaron a cabo las siguientes actividades: ¿ Desarrollo y depuración de un algoritmo que permite la separación a partir de la señal de voz original, de la estimación del pulso glótico y de la estimación del tracto vocal. ¿ Integración de dicho algoritmo en una aplicación que permite la extracción a partir de la señal de voz original, de diferentes tipos de parámetros de la voz, tanto clásicos (es decir, MFCC) como biométricos (es decir, los nuevos parámetros obtenidos a partir de la estimación de pulso glótico y de la estimación del tracto vocal). Parámetros que pueden ser utilizados posteriormente en tareas de reconocimiento. ¿ Diseño de un plataforma que permita el tratamiento automatizado de una base de datos con gran capacidad contrastiva, como es ALBAYZIN. ¿ Tratamiento de la base de datos ALBAYZIN, utilizando diferentes parámetros clásicos y diferentes tiempos de entrenamiento para establecer un punto de referencia que permita contrastar el rendimiento de dichos parámetros clásicos con los nuevos parámetros. ¿ Tratamiento de la base de datos ALBAYZIN, utilizando diferentes parámetros biométricos y diferentes tiempos de entrenamiento. ¿ Análisis de los resultados obtenidos en ambos casos. ¿ Búsqueda de métodos de fusión que permitan mejorar las tasas de reconocimiento de locutor en base a la utilización de parámetros clásicos y los nuevos parámetros biométricos. ¿ Estudio y desarrollo de un sistema de clasificación basado en SVMs (Support Vector Machines), para contrastar los resultados obtenidos mediante el sistema de clasificación basado en GMMs (Guassian Mixture Models). (En fase de pruebas)
International
Si
Place
University of Maryland
Type
Miembros en el extranjero
Start Date
01/03/2007
End Date
30/06/2007
Participants
  • Autor: Luis Miguel Mazaira Fernandez (UPM)
  • Tutor: Agustin Alvarez Marquina (UPM)
Research Group, Departaments and Institutes related
  • Creador: Grupo de Investigación: Informática Aplicada al Procesado de Señal e Imagen
  • Departamento: Arquitectura y Tecnología de Sistemas Informáticos
S2i 2020 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)