Memorias de investigación
Estancias o Sabáticos:
Estudio estadístico de la firma biométrica de los locutores para su aplicación a sistemas de identificación de locutor en entornos de seguridad.
Año:2008

Áreas de investigación
  • Procesado y análisis de la señal

Datos
Descripción
Los objetivos que se pretendían cubrir por el solicitante durante su estancia, consistían en el desarrollo e implantación de un sistema que permitiera la anotación fonética de las estimaciones de la componente glótica y de la función de transferencia de tracto vocal de la base de datos en estudio, para su posterior estudio estadístico y aplicación a los sistemas de reconocimiento de locutor, según el desglose de actividades presentado en el plan de formación. Para la consecución de este objetivo se llevaron a cabo las siguientes actividades:  Desarrollo y depuración de una herramienta software que permita la anotación fonética de la componente glótica de la señal de voz y de la función de transferencia del tracto vocal, de manera automatizada  Tratamiento automatizado de la base de datos ALBAYZIN, de modo que para cada locutor se puedan obtener las diferentes clases fonéticas que utiliza, por separado, para su posterior tratamiento.  Desarrollo de una herramienta para la visualización gráfica de las señales obtenidas, tanto en el dominio del tiempo como en el dominio de la frecuencia, así como de su correspondiente codificación paramétrica.  Estudio de la variabilidad intra- e inter-locutor de las clases fonéticas asociadas a vocales españolas, para su posterior aplicación a la tarea de reconocimiento de locutor.  Estudio de mecanismos que permitan la reducción de dimensionalidad en la representación de los modelos de los locutores, basado en PCA. Adicionalmente se han llevado a cabo las siguientes actividades:  Dada la experiencia del grupo Metiss en el área de tratamiento de señal para su aplicación al reconocimiento de locutor, se procedió a realizar una revisión de los métodos de parametrización de las estimaciones de componente glótica y función de transferencia de tracto vocal.  Estudio e implantación de la herramienta ALIZE, basada en GMM para su utilización como herramienta de referencia para la tarea de modelización y reconocimiento de locutores.  Realización de nuevos test de reconocimiento de locutor aplicando el método de normalización TNORM para su posterior comparación con los resultados iniciales. Pendiente de un análisis en mayor profundidad, se concluye que la aplicación de este método de normalización a los parámetros basados en componente glótica, produce una mejora en la tasa de reconocimiento.  Nueva revisión del estado del arte en el área de reconocimiento de locutor que ha dado como resultado la elaboración del capitulo de tesis “Introducción”, que recoge entre otros aspectos dicha revisión. Por otra parte, a parte de dichas tareas, también se han llevado a cabo las siguientes labores de divulgación de la labor investigadora:  Presentación de los resultados obtenidos hasta el momento en el ciclo de seminarios que organiza el grupo de investigación Metiss.  Presentación de los resultados obtenidos hasta el momento en el Laboratoire de Physique Théorique et Modelisation (LPTM) perteneciente a la Universidad de Cergy-Pontoise.  Organización de una reunión de trabajo con Karim Drouiche perteneciente al Grupo de Modelización Estocástica de Grandes Sistemas del LPTM, para tratar aspectos relacionados con el análisis multivariable de rasgos fonéticos, para su aplicación en el desarrollo de la tesis.  Realización de un informe detallado sobre las tareas y actividades desarrolladas.
Internacional
Si
Lugar
IRISA, RENNES, FRANCIA
Tipo
Miembros en el extranjero
Fecha inicio
01/09/2008
Fecha fin
01/12/2008

Esta actividad pertenece a memorias de investigación

Participantes

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Departamento: Arquitectura y Tecnología de Sistemas Informáticos