Memorias de investigación
Thesis:
Automatización de procedimientos en esteganografía y estegoanálisis lingüístico utilizando la lengua española
Year:2010

Research Areas
  • Electronic technology and of the communications

Information
Abstract
La protección de las comunicaciones digitales es un área de investigación y desarrollo que ha avanzado notoriamente en las últimas décadas para evitar, o minimizar, ataques de revelación, supresión o alteración de la información intercambiada entre diferentes actores. De la necesidad de desarrollar nuevos mecanismos para complementar a esta ciencia en entornos hostiles surge el interés de uso de la esteganografía. Esta ciencia se encargará de ocultar la existencia misma de una comunicación y además la información a ocultar puede ir previamente cifrada, consiguiendo así una mayor seguridad. En el avance de nuevos procedimientos esteganográficos surge el interés de utilizar mensajes en lenguaje natural para ocultar datos. Esta ciencia se conoce como esteganografía lingüística y hace uso, especialmente en la presente década, de los avances en esteganografía y en lingüística computacional. En la presente tesis se aborda esta línea de investigación aplicándola al caso concreto de la lengua española. A lo largo de la memoria, se pretende demostrar la utilidad de esta línea de investigación para la creación de canales ocultos de información y para el posible desarrollo de sistemas de marcado digital de textos con utilidad en la identificación y rastreo de documentos. En la tesis se presentan algoritmos de generación automática de estegotextos (textos con información oculta) en lengua española, se implementan herramientas que demuestran la viabilidad de esta idea y se realizan diversas medidas cuantitativas. Por otro lado, se profundiza en un estudio lingüístico sobre la posibilidad de utilizar modificaciones sintáctico-semánticas de texto en lenguaje natural con utilidad en el marcado digital de textos. Por último, se expone una propuesta de algoritmo de sustitución léxico-semántica de palabras por sus sinónimos, demostrando su interés en la creación de canales ocultos de información y su potencial en el desarrollo de sistemas de marcado en lengua española. Asimismo, se presenta una implementación de este algoritmo y se valida su seguridad confrontándolo con los ataques públicos más actuales. De los resultados obtenidos en este trabajo cabe concluir que la esteganografía lingüística en español tiene utilidad en el desarrollo de sistemas de marcado digital de textos y en la creación de canales ocultos. Es posible ocultar centenas de bits en estegotextos de tamaño medio (centenares de palabras) con utilidad en el intercambio de mensajes breves, direcciones de Internet (urls, IPs, puertos, etc.), el envío de coordenadas GPS, intercambio de claves criptográficas, etc.
International
No
Type
Doctoral
Mark Rating
Sobresaliente cum laude
Date
21/12/2010
Participants
  • Director: Justo Carracedo Gallardo UPM

Research Group, Departaments and Institutes related
  • Creador: Grupo de Investigación: Sistemas Telemáticos para la Sociedad de la Información y el conocimiento
  • Departamento: Ingeniería y Arquitecturas Telemáticas