Observatorio de I+D+i UPM

Memorias de investigación
Ponencias en congresos:
Towards an Unsupervised Speaking Style Voice Building Framework: Multi-Style Speaker Diarization
Año:2012
Áreas de investigación
  • Tecnología electrónica y de las comunicaciones,
  • Ingeniería eléctrica, electrónica y automática
Datos
Descripción
Current text-to-speech systems are developed using studio-recorded speech in a neutral style or based on acted emotions. However, the proliferation of media sharing sites would allow developing a new generation of speech-based systems which could cope with spontaneous and styled speech. This paper proposes an architecture to deal with realistic recordings and carries out some experiments on unsupervised speaker diarization. In order to maximize the speaker purity of the clusters while keeping a high speaker coverage, the paper evaluates the F?measure of a diarization module, achieving high scores (>85%) especially when the clusters are longer than 30 seconds, even for the more spontaneous and expressive styles (such as talk shows or sports).
Internacional
Si
Nombre congreso
InterSpeech 2012, 13th Annual Conference of the International Speech Communication Association
Tipo de participación
960
Lugar del congreso
Portland, Oregon
Revisores
Si
ISBN o ISSN
1990-9772
DOI
Fecha inicio congreso
09/09/2012
Fecha fin congreso
13/09/2012
Desde la página
1
Hasta la página
4
Título de las actas
InterSpeech 2012, 13th Annual Conference of the International Speech Communication Association
Esta actividad pertenece a memorias de investigación
Participantes
  • Autor: Jaime Lorenzo Trueba (UPM)
  • Autor: Beatriz Martinez Gonzalez (UPM)
  • Autor: Roberto Barra Chicote (UPM)
  • Autor: Veronica Lopez Ludeña (UPM)
  • Autor: Javier Ferreiros Lopez (UPM)
  • Autor: Yunichi Yamagishi (Centre for Speech Technology Research, University of Edinburgh, United Kingdom)
  • Autor: Juan Manuel Montero Martinez (UPM)
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Tecnología del Habla
  • Departamento: Ingeniería Electrónica
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)