Memorias de investigación
Ponencias en congresos:
Glottal Source Cepstrum Coefficients Applied to NIST SRE 2010
Año:2010

Áreas de investigación
  • Tecnología electrónica y de las comunicaciones

Datos
Descripción
Through the present paper, a novel feature set for speaker recognition based on glottal estimate information is presented. An iterative algorithm is used to derive the vocal tract and glottal source estimations from speech signal. In order to test the importance of glottal source information in speaker characterization, the novel feature set has been tested in the 2010 NIST Speaker Recognition Evaluation (NIST SRE10). The proposed system uses glottal estimate parameter templates and classical cepstral information to build a model for each speaker involved in the recognition process. ALIZE [1] open-source software has been used to create the GMM models for both background and target speakers. Compared to using mel-frequency cepstrum coefficients (MFCC), the misclassification rate for the NIST SRE 2010 reduced from 29.43% to 27.15% when glottal source features are used.
Internacional
No
Nombre congreso
V Jornadas de Reconocimiento Biométrico de Personas JRBP10
Tipo de participación
960
Lugar del congreso
Huesca
Revisores
Si
ISBN o ISSN
0000000000000
DOI
Fecha inicio congreso
02/09/2010
Fecha fin congreso
03/09/2010
Desde la página
0
Hasta la página
0
Título de las actas
Actas de las V Jornadas de Reconocimiento Biométrico de Personas JRBP10

Esta actividad pertenece a memorias de investigación

Participantes

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Informática Aplicada al Procesado de Señal e Imagen