Solving a Big-Data Problem with GPU: The Network Traffic Analysis
Mercedes Barrionuevo, Mariela Lopresti, Natalia Miranda, Fabiana Piccoli
Journal of Computer Science & Technology, ISSN 1666-6046, Vol. 15, n. 1, 2015, p. 30-39
El número de dispositivos conectados a Internet ha aumentado de manera significativa y crecerá exponencialmente en un futuro cercano; es debido a los costes más bajos. Se espera que en los próximos años, el tráfico de datos a través de Internet aumente hasta valores en torno al zetabyte. Como consecuencia de este incremento, se puede observar que el tráfico de datos está creciendo más rápidamente que la capacidad de su procesamiento. En los últimos años, la identificación del tráfico de Internet generado por las diferentes aplicaciones se ha convertido en uno de los principales desafíos para las redes de telecomunicaciones.
Esta caracterización se basa en la comprensión de la composición y dinámica del tráfico de Internet para mejorar el rendimiento de la red. Analizar la gran cantidad de datos generados por las redes de tráfico en tiempo real requiere más potencia y capacidad de computación. Una buena opción es aplicar técnicas de computación de alto rendimiento (High Performance Computing) en este problema, empleando específicamente unidades de procesamiento gráfico (Graphics Processing Unit (GPU)). Sus características principales son alta potencia de cálculo, desarrollo constante y bajo coste, además proporciona un kit de programación llamado CUDA. Ofrece una interfaz GPUCPU, sincronización de procesos, tipos de datos, entre otros. En este artículo presentamos las causas del incremento de volúmenes de datos que circulan en la red, análisis de datos y seguimiento de las técnicas actuales, y la viabilidad de la combinación de técnicas de minería de datos con la GPU para resolver este problema y acelerar los tiempos de respuesta.
Traducción del resumen de la propia publicación