Observatorio de I+D+i UPM

| Otras actividades
HOME

Proyectos Internacionales Art�culos Patentes UPM Software UPM Empresas UPM Otras actividades Memorias de investigaci�n

Memorias de investigación

Ponencias en congresos:

Architecture for Text Normalization using Statistical Machine Translation techniques

A�o:2012

�reas de investigaci�n

Tecnolog�a electr�nica y de las comunicaciones,
Ingenier�a el�ctrica, electr�nica y autom�tica

Datos

Descripci�n
This paper proposes an architecture, based on statistical machine translation, for developing the text normalization module of a text to speech conversion system. The main target is to generate a language independent text normalization module, based on data and flexible enough to deal with all situa-tions presented in this task. The proposed architecture is composed by three main modules: a tokenizer module for splitting the text input into a token graph (tokenization), a phrase-based translation module (token translation) and a post-processing module for removing some tokens. This paper presents initial exper-iments for numbers and abbreviations. The very good results obtained validate the proposed architecture.
Internacional	Si
Nombre congreso	IberSPEECH 2012
Tipo de participaci�n	960
Lugar del congreso	Madrid Spain
Revisores	Si
ISBN o ISSN	84-616-1535-2
DOI
Fecha inicio congreso	21/11/2012
Fecha fin congreso	22/11/2012
Desde la p�gina	204
Hasta la p�gina	213
T�tulo de las actas	VII Jornadas en Tecnolog�a del Habla and III Iberian SLTech Workshop

Ver publicaci�n en Archivo digital upm

Esta actividad pertenece a memorias de investigaci�n

Participantes

Autor: Veronica Lopez Lude�a UPM
Autor: Ruben San Segundo Hernandez UPM
Autor: Juan Manuel Montero Martinez UPM
Autor: Roberto Barra Chicote UPM
Autor: Jaime Lorenzo Trueba UPM

Grupos de investigaci�n, Departamentos, Centros e Institutos de I+D+i relacionados

Creador: Grupo de Investigaci�n: Grupo de Tecnolog�a del Habla
Departamento: Ingenier�a Electr�nica