Un enfoque escalable para la minería de datos – AHUIM

Un enfoque escalable para la minería de datos – AHUIM
19 de Noviembre de 2021

 

 

A scalable approach for data mining – AHUIM

Vandna Dahiya and Sandeep Dalal

Webology, ISSN 1735-188X, Vol. 18, n. 1, 2021, p. 92-103

Se propone una nueva técnica de minería de datos de forma distribuida basada en Spark, denominada Minería de Elementos de Alta Utilidad Absoluta (Absolute High Utility Itemset Mining/AHUIM) que intenta paliar las limitaciones de la minería de conjuntos de elementos frecuentes (Frequent Itemset Mining/FIM). FIM es una técnica centrada en la frecuencia de ocurrencia de los elementos de un conjunto de datos.

https://www.webology.org/abstract.php?id=389Explora los conjuntos de datos basándose en los estándares de apoyo y confianza de estos datos, sin embargo, FIM no tiene en cuenta el valor de cada uno de los elementos. Es decir, puede haber elementos con menos ocurrencias pero más valor para los usuarios.  En este sentido, la minería de conjuntos elementos de alta utilidad ha surgido como una técnica superior de minería de datos que extrae conjuntos de elementos en función de sus factores de utilidad. La utilidad se especifica en términos de cantidad y algún factor de interés, y el algoritmo busca clasificar el conjunto de elementos para los que la utilidad supera el umbral predefinido. Los investigadores han desarrollado hasta ahora varios métodos para extraer estos conjuntos de elementos, pero la mayoría de ellos no son escalables. En la actualidad, se requiere un enfoque escalable que pueda satisfacer las necesidades en ciernes de la minería de datos, puesto que los algoritmos UIM convencionales no son adecuados para grandes conjuntos de datos. Sin embargo, el nuevo algoritmo AHUIM proporciona consistencia temporal, escalabilidad, exactitud y estabilidad, lo cual se ha demostrado en diversos experimentos sistemáticos. Así mismo, AHUIM puede mejorarse con otras características de UIM.

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.