Descripción
|
|
---|---|
Este artículo describe el proceso de generación de una voz en castellano utilizando el corpus UPC ESMA de UPC proporcionado por la Evaluación Albayzín 2008: Conversión Texto a Voz. Se ha implementado una voz basada en selección de unidades mediante el paquete Multisyn de Festival y otra basada en Hidden Semi-Markov Models (HSMM) mediante HTS. Tras una breve evaluación de la calidad de ambas voces, se detallan las características principales de la voz basada en HSMM, sistema final presentado a la evaluación. | |
Internacional
|
No |
Nombre congreso
|
V Jornadas en Tecnología del Habla |
Tipo de participación
|
960 |
Lugar del congreso
|
Bilbao |
Revisores
|
Si |
ISBN o ISSN
|
978-84-9860-169-5 |
DOI
|
|
Fecha inicio congreso
|
12/11/2008 |
Fecha fin congreso
|
14/11/2008 |
Desde la página
|
115 |
Hasta la página
|
118 |
Título de las actas
|
Actas de V Jornadas en Tecnología del Habla |