Observatorio de I+D+i UPM

Memorias de investigación
Tesis:
Inclusión de información de dominio para datos en modelos de clustering basados en densidad para datos estáticos y data stream
Año:2009
Áreas de investigación
  • Inteligencia artificial
Datos
Descripción
M¿as de tres d¿ecadas de existencia de la investigaci¿on en data mining han demostrado que el an¿alisis, construcci¿on, ejecuci¿on y evaluaci¿on de modelos de data mining est¿a determinado por la influencia que ejerce la dependencia del conocimiento del dominio. Esta informaci¿on de dominio se utiliza para establecer los criterios de validez, utilidad y ¿exito de los modelos obtenidos, y por tanto, se necesitan m¿etodos efectivos de incluir dicha informaci¿on de dominio durante el proceso de an¿alisis y construcci¿on de los modelos. La inclusi¿on de informaci¿on de dominio en los m¿etodos de aprendizaje no supervisado donde la evaluaci¿on depende en mayor grado de la visi¿on y expectativas del usuario ha atra¿¿do gran inter¿es en los ¿ultimos a¿nos provocando la aparici¿on de diferentes tendencias. En concreto, el clustering semi-supervisado trata de paliar los problemas que la interpretaci¿on y evaluaci¿on puede acarrear y permite incluir informaci¿on de dominio dentro del m¿etodo de clustering. Sin embargo, y a pesar de los buenos resultados demostrados en dichos m¿etodos, en m¿etodos basados en densidad no existe ninguna soluci¿on satisfactoria. Por otro lado, el r¿apido crecimiento y complejidad de los sistemas inform¿aticos y las comunicaciones ha provocado que las aplicaciones online y en tiempo real donde se generan a gran velocidad y almacenan cantidades de datos gigantescas a lo largo del tiempo proliferen en todos los ¿ambitos sociales, comerciales y de investigaci¿on. Estas nuevas caracter¿¿sticas y avances de los sistemas inform¿aticos suponen nuevos retos para los procesos data mining, que deben adaptar las soluciones cl¿asicas de an¿alisis offline o por lotes a soluciones capaces de analizar data streams. La distribuci¿on no estacionaria de estos datos que pueden evolucionar a lo largo del tiempo, obligan a la actualizaci¿on de los patrones que se descubren de acuerdo a dicha evolucion. En esta tesis se aborda consecuentemente la inclusion de dominio en metodos basados en desidad. Se da una solución de un algoritmo para datos estáticos y otrao para data stream y se validan ambos enfoques
Internacional
Si
ISBN
Tipo de Tesis
Doctoral
Calificación
Sobresaliente cum laude
Fecha
14/12/2009
Esta actividad pertenece a memorias de investigación
Participantes
  • Director: Ernestina Menasalvas Ruiz (UPM)
Grupos de investigación, Departamentos, Centros e Institutos de I+D+i relacionados
  • Creador: Grupo de Investigación: Data Mining Engineering (DaME) Ingeniería de Minería de datos
  • Departamento: Lenguajes y Sistemas Informáticos e Ingeniería de Software
S2i 2021 Observatorio de investigación @ UPM con la colaboración del Consejo Social UPM
Cofinanciación del MINECO en el marco del Programa INNCIDE 2011 (OTR-2011-0236)
Cofinanciación del MINECO en el marco del Programa INNPACTO (IPT-020000-2010-22)