Memorias de investigación
Tesis:
Automatización de procedimientos en esteganografía y estegoanálisis lingüístico utilizando la lengua española
Año:2010

Áreas de investigación
  • Tecnología electrónica y de las comunicaciones

Datos
Descripción
La protección de las comunicaciones digitales es un área de investigación y desarrollo que ha avanzado notoriamente en las últimas décadas para evitar, o minimizar, ataques de revelación, supresión o alteración de la información intercambiada entre diferentes actores. De la necesidad de desarrollar nuevos mecanismos para complementar a esta ciencia en entornos hostiles surge el interés de uso de la esteganografía. Esta ciencia se encargará de ocultar la existencia misma de una comunicación y además la información a ocultar puede ir previamente cifrada, consiguiendo así una mayor seguridad. En el avance de nuevos procedimientos esteganográficos surge el interés de utilizar mensajes en lenguaje natural para ocultar datos. Esta ciencia se conoce como esteganografía lingüística y hace uso, especialmente en la presente década, de los avances en esteganografía y en lingüística computacional. En la presente tesis se aborda esta línea de investigación aplicándola al caso concreto de la lengua española. A lo largo de la memoria, se pretende demostrar la utilidad de esta línea de investigación para la creación de canales ocultos de información y para el posible desarrollo de sistemas de marcado digital de textos con utilidad en la identificación y rastreo de documentos. En la tesis se presentan algoritmos de generación automática de estegotextos (textos con información oculta) en lengua española, se implementan herramientas que demuestran la viabilidad de esta idea y se realizan diversas medidas cuantitativas. Por otro lado, se profundiza en un estudio lingüístico sobre la posibilidad de utilizar modificaciones sintáctico-semánticas de texto en lenguaje natural con utilidad en el marcado digital de textos. Por último, se expone una propuesta de algoritmo de sustitución léxico-semántica de palabras por sus sinónimos, demostrando su interés en la creación de canales ocultos de información y su potencial en el desarrollo de sistemas de marcado en lengua española. Asimismo, se presenta una implementación de este algoritmo y se valida su seguridad confrontándolo con los ataques públicos más actuales. De los resultados obtenidos en este trabajo cabe concluir que la esteganografía lingüística en español tiene utilidad en el desarrollo de sistemas de marcado digital de textos y en la creación de canales ocultos. Es posible ocultar centenas de bits en estegotextos de tamaño medio (centenares de palabras) con utilidad en el intercambio de mensajes breves, direcciones de Internet (urls, IPs, puertos, etc.), el envío de coordenadas GPS, intercambio de claves criptográficas, etc.
Internacional
No
ISBN
Tipo de Tesis
Doctoral
Calificación
Sobresaliente cum laude
Fecha
21/12/2010

Esta actividad pertenece a memorias de investigación

Participantes
  • Director: Justo Carracedo Gallardo UPM

Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Sistemas Telemáticos para la Sociedad de la Información y el conocimiento
  • Departamento: Ingeniería y Arquitecturas Telemáticas