Observatorio de I+D+i UPM

Memorias de investigación
Artículos en revistas:
Low-Cost Speaker and Language Recognition Systems Running on a Raspberry Pi
Año:2014
Áreas de investigación
  • Tecnología electrónica y de las comunicaciones,
  • Ingeniería eléctrica, electrónica y automática
Datos
Descripción
This paper describes two state-of-the-art and portable voice-based authentication and language recognition systems. While the authentication system allows secure access to a media center at home, the language recognition system can be used as a previous step to automatically transcribe and translate the recognized text from its original language into another one. The most important advantage of the developed systems is that they can run on a low cost embedded device, such as a Raspberry Pi (RPi), and using only open-source projects, which makes it feasible to replicate or include in other systems, but also allows its implementation as part of educational projects in electronics. The developed systems have been tested on real data with very good results. Regarding the authentication system, the validation process is done in 3.3 seconds in average with an Equal Error Rate (EER) of 19% on test files with 20 seconds, and tested with up to 87 different speakers. On the other hand, the language recognition system is able to recognize up to six languages. For this system, important efforts were done in order to reduce the processing time and memory requirements while keeping high the recognition rate. The final system uses 64 Gaussians and 200 i-vectors, obtaining an average cost error rate (Cavg) of 8.6% for the six languages.
Internacional
Si
JCR del ISI
Si
Título de la revista
Ieee Latin America Transactions
ISSN
1548-0992
Factor de impacto JCR
0,186
Información de impacto
Volumen
12
DOI
Número de revista
4
Desde la página
755
Hasta la página
763
Mes
SIN MES
Ranking
237/247
Esta actividad pertenece a memorias de investigación
Participantes
  • Autor: Luis Fernando D'Haro Enriquez (UPM)
  • Autor: Ricardo de Cordoba Herralde (UPM)
  • Autor: José Ignacio Rojo (estudiante de cuarto curso del Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación en la UPM)
  • Autor: Jorge Diez García-Olalla (estudiante de cuarto curso del Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación en la UPM)
  • Autor: Diego Avedaño (estudiante de cuarto curso del Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación en la UPM)
  • Autor: José María Bermudo (estudiante de cuarto curso del Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación en la UPM)
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Grupo de Tecnología del Habla
  • Departamento: Ingeniería Electrónica
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)