Plataforma de HPC portable de bajo consumo energético para aplicaciones de minería de datos / Portable low-power High Performance Computing (HPC) Platform for data mining applications

  • Armando Saúl Carranza Sánchez Instituto Tecnológico de Colima
  • Jesús Alberto Verduzco Ramírez Instituto Tecnológico de Colima
  • Nicandro Farías Mendoza Instituto Tecnológico de Colima
  • Francisco Cervantes Zambrano Instituto Tecnológico de Colima
  • Fernando Rodríguez Haro Universidad de Colima
Palabras clave: clúster, sistemas embebidos, computación de alto rendimiento, Sistema en Chip (SoC), minería de datos.

Resumen

La necesidad de plataformas computacionales que proporcionen soporte a las aplicaciones denominadas intensivas ha estado incrementándose en muchas organizaciones debido al surgimiento de una serie de aplicaciones que requieren de manejo intensivo de datos y tiempos de respuesta cortos. Un ejemplo pueden ser las aplicaciones que utilizan la minería de datos. El hardware ha evolucionado de manera acelerada para satisfacer estas necesidades del cómputo intensivo. Por otro lado, pequeñas computadoras montadas en tarjetas denominadas SoC (System on Chip) (R., G., y M., 2013) han aparecido a partir de la miniaturización de componentes y la popularización de los sistemas embebidos, El ejemplo más significativo es Raspberry Pi (raspberrypi, 2016), una alternativa de bajo costo y consumo energético reducido que permite realizar tareas de cómputo. Debido a su popularidad, los fabricantes se han dedicado a incrementar su desempeño generando modelos con mayores prestaciones, los cuales se han vuelto una opción viable para el procesamiento intensivo de datos. Aquí analizamos dicho aspecto. Para ello se describe la construcción de una plataforma de HPC basada en tarjetas SoC, lo que permite desarrollar y ejecutar aplicaciones de minería de datos. Los resultados obtenidos en las diferentes pruebas de operación y tolerancia a fallas muestran que dicha plataforma ofrece el rendimiento y la robustez necesarios para ser utilizada en el desarrollo de aplicaciones de minería de datos orientadas a la educación y también para la enseñanza de la disciplina antes mencionada, con una inversión que es posible alcanzar en instituciones académicas y pequeñas organizaciones.

Citas

A. Petitet, R. C. Whaley, J. Dongarra, A. Cleary (15 de Diciembre de 2016). HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers. Obtenido de HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers: http://www.netlib.org/benchmark/hpl/

Apache. (05 de Octubre de 2016). Apache Hadoop. Obtenido de Apache Hadoop: http://hadoop.apache.org/

Apache. (15 de 01 de 2017). Apache Pig. Obtenido de https://pig.apache.org/

Barr, M., & Massa, A. (2006). Programming Embedded Systems: With C and GNU Development Tools. O'REILLY.

Conaway, S. (03 de 07 de 2014). High Performance Data Analysis: Big Data Meets HPC. High Performance Data Analysis: Big Data Meets HPC. Recuperado el 14 de 02 de 2017, de http://www.scientificcomputing.com/blog/2014/03/high-performance-data-analysis-big-data-meets-hpc

Cubieboard. (9 de Septiembre de 2016). Obtenido de cubieboard: http://cubieboard.org/

Díaz, G. (31 de Mayo de 2016). Modelos de Programación Paralela. Merida, Venezuela.

F. Cloutier, M., Paradis, C., & M. Weaver, V. (2014). Design and Analysis of a 32-bit Embedded High-Performance Cluster Optimized for Energy and Performance. Hardware-Software Co-Design for High Performance Computing (Co-HPC), 2014. doi:10.1109/Co-HPC.2014.7

Garcia Nocetti, F. (Junio de 2014). Cómputo de Alto Rendimiento (HPC) & Big Data. Obtenido de Cómputo de Alto Rendimiento (HPC) & Big Data: http://www.inegi.org.mx/eventos/2014/big-data/doc/P-DemetrioGarcia.pdf

Google. (15 de 10 de 2016). https://www.android.com/. Obtenido de https://www.android.com/

HADOOP. (2014). HADOOP big data analysis framework. tutorialspoint.

J. Greaves, D. (2011). System on Chip Design and Modelling. System on Chip Design and Modelling. Cambridge, Inglaterra.

Lubuntu. (05 de Octubre de 2016). Obtenido de Lubuntu: http://lubuntu.net/

Pérez López, C. (2008). Minería de Datos Técnicas y Herramientas. Madrid: Thomson.

R, R., G, M., & M, A. P. (2013). System on Chip (SoC) for Telecommand System Design. International Journal of Advanced Research in Computer and Communication Engineering, 1580-1585.

Rajovic, N. R.-J.-F. (2016). The Mont-Blanc prototype: An Alternative Approach for HPC Systems.

Rajovic, N., Rico, A., Puzovic, N., Adeniyi Jones, C., & Ramirez, A. (2014). Making the Case for an ARM-Based HPC System. ELSEVIER, 322-334.

Ramos, J. A. (23 de Abril de 2014). https://www.adictosaltrabajo.com. Recuperado el 15 de Enero de 2017, de https://www.adictosaltrabajo.com: https://www.adictosaltrabajo.com/tutoriales/pig-first-steps/

Raspberrypi. (9 de Septiembre de 2016). Obtenido de raspberrypi: https://www.raspberrypi.org/

Solano, H. L., & �lvarez, C. R. (2005). Estadística descriptiva y distribuciones de probabilidad. Barranquilla: Ediciones Uninorte.

Srisuruk, W., & Kaewkasi, C. (s.f.). Low-Power Big Data Cluster. Low-Power Big Data Cluster. Suranaree, Tailandia. Obtenido de https://indico.cern.ch/event/311156/contributions/1684547/attachments/595776/819978/aiyara_cluster.pdf

Valero, M., Rajovic, N., M. Carpenter, P., Gelado, I., Puzovic, N., & Ramirez, A. (2013, Noviembre 17-22). Supercomputing with Commodity CPUs: Are Mobile SoCs Ready for HPC? 2013 SC - International Conference for High Performance Computing, Networking, Storage and Analysis (SC), 1-12. Denver,Co: IEEE. doi:10.1145/2503210.2503281

Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE Transactions on Knowledge and Data Engineering, 97 - 107. doi:10.1109/TKDE.2013.109

Publicado
2017-05-19
Cómo citar
Carranza Sánchez, A. S., Verduzco RamírezJ. A., Farías MendozaN., Cervantes Zambrano, F., & Rodríguez HaroF. (2017). Plataforma de HPC portable de bajo consumo energético para aplicaciones de minería de datos / Portable low-power High Performance Computing (HPC) Platform for data mining applications. RECI Revista Iberoamericana De Las Ciencias Computacionales E Informática, 6(11), 99 - 116. https://doi.org/10.23913/reci.v6i11.62
Sección
Artículos Cientificos

Artículos más leídos del mismo autor/a