Memorias de investigación
Artículos en revistas:
Speaker Diarization Features: The UPM Contribution to the RT09 Evaluation
Año:2011

Áreas de investigación
  • Tecnología electrónica y de las comunicaciones,
  • Ingeniería eléctrica, electrónica y automática

Datos
Descripción
Two new features have been proposed and used in the Rich Transcription Evaluation 2009 by the Universidad Politécnica de Madrid, which outperform the results of the baseline system. One of the features is the intensity channel contribution, a feature related to the location of the speaker. The second feature is the logarithm of the interpolated fundamental frequency. It is the first time that both features are applied to the clustering stage of multiple distant microphone meetings diarization. It is shown that the inclusion of both features improves the baseline results by 15.36% and 16.71% relative to the development set and the RT 09 set, respectively. If we consider speaker errors only, the relative improvement is 23% and 32.83% on the development set and the RT09 set, respectively.
Internacional
Si
JCR del ISI
Si
Título de la revista
Ieee Transactions on Audio, Speech, And Language Processing
ISSN
1558-7916
Factor de impacto JCR
1,668
Información de impacto
Volumen
20
DOI
10.1109/TASL.2011.2159971
Número de revista
2
Desde la página
426
Hasta la página
435
Mes
SIN MES
Ranking
Q1

Esta actividad pertenece a memorias de investigación

Participantes

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Tecnología del Habla
  • Departamento: Ingeniería Electrónica