Observatorio de I+D+i UPM

| Otras actividades
HOME

Proyectos Internacionales Art�culos Patentes UPM Software UPM Empresas UPM Otras actividades Memorias de investigaci�n

Memorias de investigación

Estancias o Sab�ticos:

Investigador visitante en el centro CSTR para el proyecto "Nuevas t�cnicas de s�ntesis de habla expresiva basada en Modelos de Markov" "Research on expressive speech synthesis". Estancia en el CSTR de Edimburgo.

A�o:2013

�reas de investigaci�n

Tecnolog�a electr�nica y de las comunicaciones,
Ingenier�a el�ctrica, electr�nica y autom�tica

Datos

Descripci�n
Recibida Ayuda de investigaci�n del Ministerio de Educaci�n para realizar una estancia en el CSTR de Edimburgo (de 3/5/2013 a 29/7/2013) Para conseguir sistemas de interacci�n vocal que sean usados con �xito en un gran conjunto de aplicaciones, debemos ser capaces de crear voces que sean apropiadas al contexto de aplicaci�n, sin tener que recurrir al concurso de expertos humanos (desde ingenieros a ling�istas) que proporcionen una gran cantidad de datos etiquetados muy costosos. Una de las principales limitaciones de los sistemas de conversi�n texto-habla actuales es el limitado rango de estilos de habla que presentan, limit�ndose a voz le�da o emociones actuadas, estilos que aunque resultan interesantes y he desarrollado a lo largo de mi carrera investigadora, no cubren el espectro posible de aplicaciones de la s�ntesis de habla, que incluye sistemas de di�logo persona-m�quina, juegos asistentes personales, e-learning, etc�tera. En este proyecto de investigaci�n me propongo investigar en la extrapolaci�n del estilo de habla de un conjunto de grabaciones de uno o varios locutores, a la voz de otros locutores para los cuales no disponemos de grabaciones de ese estilo, aunque disponemos de grabaciones de estilo est�ndar de voz le�da neutralizada, y en la incorporaci�n de un nuevo modelo de habla que permita incorporar intr�nsecamente la expresividad dentro del modelo. El �xito de mi investigaci�n conducir�a a un sistema de s�ntesis adaptable a un nuevo dominio de aplicaci�n sin necesidad de disponer de datos del locutor cuyo timbre queremos emplear en nuestra aplicaci�n, pudi�ndose dotar de mayor expresividad, por ejemplo, a una voz que carece de ellos, de la misma manera que un locutor profesional adapta su estilo de habla a cada trabajo que se le contrata. Con las nuevas t�cnicas propuestas de extrapolaci�n de estilos, adem�s de avanzar el estado del arte de las t�cnicas de s�ntesis, se podr�n crear servicios innovadores por parte de peque�as empresas y organizaciones que permitan superar las barreras de coste actuales en el desarrollo de nuevas aplicaciones de valor a�adido que gocen de una interacci�n mucho m�s rica entre las personas y los sistemas inform�ticos, con capacidad para generar se�ales o indicios sociales no verbales que vayan m�s all� de la simple transmisi�n oral de un mensaje. Para poder realizar una extrapolaci�n de estilos de habla, necesitamos disponer de un sistema de habla param�trico, que permita disponer de un modelo matem�tico robusto y flexible sobre el que aplicar las transformaciones y adaptaciones de estilos que necesitamos, transformaciones que deben ser capaces de alterar el estilo de habla o la emoci�n del modelo de habla de una persona, alternando m�nimamente la personalidad de su voz, de tal manera que tras la transformaci�n, su voz transformada no pueda ser confundida con la voz de los locutores que han servido de base para extrapolar el nuevo estilo. El modelo de s�ntesis de habla m�s apropiado hoy en d�a es el que nos proporciona el sistema Festival/HTS de que dispone el centro CSTR de la Universidad de Edimburgo, y con quien llevo colaborando en los �ltimos a�os. Objetivos: - Incorporar a un sistema de s�ntesis expresiva nuevos modelos de habla que est�n m�s cerca del mecanismo de producci�n humano y sean intr�nsecamente capaces de producir muchos tipos de voz o expresividad: se usar�n las nuevas t�cnicas basadas en GIF (filtrado glotal inverso) y WLP (Predicci�n lineal ponderada) en las que investigamos CSTR y UPM en colaboraci�n con la Universidad de Aalto dentro del proyecto europeo Simple4All. - Crear modelos con la capacidad incorporada para generar voz expresiva y que se puedan generalizar a trav�s de los distintos locutores y estilos de habla o emociones por medio de t�cnicas de extrapolaci�n.
Internacional	Si
Lugar	Edimburgo, Reino Unido.
Tipo	Miembros en el extranjero
Fecha inicio	01/05/2013
Fecha fin	31/07/2013

Esta actividad pertenece a memorias de investigaci�n

Participantes

Autor: Juan Manuel Montero Martinez UPM

Grupos de investigaci�n, Departamentos, Centros e Institutos de I+D+i relacionados

Creador: Grupo de Investigaci�n: Grupo de Tecnolog�a del Habla
Departamento: Ingenier�a Electr�nica