Computación de alto rendimiento

Áreas del conocimiento principal.

Código UNESCO Descripción Disciplina o Subdisciplina UNESCO
1203.04 Inteligencia Artificial
3304.17 Sistemas en Tiempo Real
5701.04 Lingüística Informatizada

Áreas del conocimiento relacionadas.

Código UNESCO Descripción Disciplina o Subdisciplina UNESCO
3304.06 Arquitectura de Ordenadores
3304.15 Ordenadores Híbridos
3304.04 Unidades Centrales de Proceso

Justificación.

Actualmente, los dispositivos digitales móviles en conjunto con las tecnologías de la información y comunicación (TICs) se han convertido en un elemento trascendental para el desarrollo de la sociedad. Esto se debe a la globalización del acceso a Internet que da paso a un mundo interconectado e impregnado de tecnología [1],[2]. Es por esto que, el acceso a Internet, y el crecimiento de la web 2.0 [3], en especial, el uso de las redes sociales, blogs, servicios web, video juegos, sistemas de realidad virtual, entre otros están introduciendo, de manera silenciosa e imparable, un cambio en las costumbres de la sociedad. Así, el acceso y tratamiento de volúmenes considerables de datos a través de herramientas de búsqueda, clasificación, valoración y difusión [4], a más de la versatilidad para establecer vínculos personales, está afectando diversas estructuras cotidianas: desde el ocio hasta la política [5]. Por tales motivos, el grupo de investigación en Cloud Computing, Smart Cities & High Performance Computing busca generar investigaciones científicas de alto impacto en la línea de investigación de cómputo de alto rendimiento (HPC, por sus siglas en inglés) para acelerar y/o optimizar algoritmos de inteligencia artificial, aprendizaje de máquina, procesamiento de lenguaje natural, entre otros, utilizando unidades de procesamiento gráficas, múltiples unidades de procesamiento central, clústeres de computadoras, entre otros equipos de hardware para la implementación de sistemas distribuidos, sistemas en tiempo real, sistemas de realidad virtual, entre otros.

Objetivos de la línea de investigación

Contribuir a incrementar las competencias de la Universidad Politécnica Salesiana y la comunidad científica nacional e internacional en el área de computo de alto rendimiento a través de la ejecución de actividades de investigación, desarrollo e innovación para acelerar y optimizar algoritmos de inteligencia artificial, aprendizaje de máquina y procesamiento de lenguaje natural a través de unidades de procesamiento gráficas, múltiples unidades de procesamiento central, clústeres de computadoras, entre otros equipos de hardware desplegados en sistemas de información: heterogéneos, distribuidos, en tiempo real, de realidad virtual, entre otros.

Benefactores

Los benefactores de los procesos de investigación llevados a cabo dentro del grupo de investigación son los estudiantes de la Universidad Politécnica Salesiana quienes pueden manipular procesos de computo de alto rendimiento a través de equipos de hardware especializados y a su vez presentar los resultados de la ejecución de dichos algoritmos en sistemas de información distribuidos, en tiempo real o virtuales. Así como también, la comunidad científica que centra sus investigaciones en el área de computo de alto rendimiento a través de súper ordenadores. Por último, las empresas de tecnologías de información que buscan mejorar y optimizar sus procesos a través del sistemas de información con la capacidad de procesar, analizar y visualizar grandes volúmenes de datos.

Estado del arte.

La World Wide Web se ha hecho muy popular en las ultimas décadas, y se ha convertido en una plataforma muy poderosa para buscar y obtener información de nuestro interés, actualmente la Web es considerada como un repositorio de big data [6] con una gran variedad de información a nuestro alcance [7]. Así mismo en los últimos años con la llegada de la Web 2.0 [8] nos hemos encontrado con las redes sociales en línea, que cada vez son mas populares entre los usuarios para compartir información abiertamente a la Web, es por esto que se ha visto la necesidad de entender el papel que juegan las redes sociales [9] en eventos específicos como por ejemplo la influencia de los comentarios vertidos en redes sociales para que un posible candidato a elecciones presidenciales resulte ganador, o como influencian las redes sociales para que una marca o producto tenga mayor presencia en el mercado local, o incluso como podemos utilizar la información obtenida de redes sociales para evitar actos de terrorismo, masacres, actos de violencias, etc.

A fin de poder analizar esta información e inferir conocimiento a partir de ella se debe aplicar métodos computacionales basados en algoritmos de inteligencia artificial, aprendizaje de máquina, procesamiento de lenguaje natural, entre otros métodos estadísticos y matemáticos. Sin embrago, la información que existe en la Web cada vez es mas extensa, por lo que necesitamos nuevos paradigmas que nos permitan analizar toda la información existente, una de esas nuevas tecnologías es la que se conoce como High Performance Computing (HPC) o Computo de Alto Rendimiento, que proponen mejorar tanto la eficiencia como el rendimiento de los algoritmos basándose en nuevos recursos de hardware existentes como lo son las unidades gráficas de procesamiento [9]. Hoy en día, las unidades de procesamiento gráfica (GPU, por sus siglas en inglés) no son utilizadas únicamente para acelerar los videos, videojuegos, películas entre otros mediante la renderización de imágenes sino que también con el uso de los núcleos de sus procesadores se tiene la ventaja de poder ejecutar varios hilos en paralelo y resolver rápidamente grandes problemas referentes a cómputos científico, teniendo como resultado un paralelismo inherente en estos procesos [10].

Desde hace algunos años la corporación NVIDIA ha estado en la cima en cuanto al desarrollo de tecnología para la GPU, es por esto que desde el año 2006 se ha trabajado en el desarrollo de una arquitectura que nos permita potencializar las bondades que nos presenta las GPUs, teniendo como resultado el desarrollo de CUDA arquitectura que nos permite interactuar con las unidades gráficas de procesamiento tanto a nivel de software como de hardware, con la finalidad de poder realizar cómputos en paralelo [11]. Con CUDA los programadores tienen acceso directo a la memoria de la GPU, que les permite escribir algoritmos paralelizados no solo para aplicaciones gráficas sino también para aplicaciones de propósito general lo cual se conoce termino que se conoce en la actualidad GPGPU (computo de propósito general en la unidad gráfica de procesamiento) [12].

Por último, según la ley de moore cada año las GPUs crecen el doble en cuanto a su capacidad de paralelismo, actualmente NVIDIA cuenta con la familia de GPUs denominada Tesla desarrollada exclusivamente para análisis de datos y computo científico, actualmente existe la P100 [13] esta tarjeta puede alcanzar una precisión de 5.3 teraFLOPS, con una memoria global de hasta 32 GB y con 3584 núcleos CUDA. Una de las ventajas de CUDA como lenguaje de programación es la escalabilidad que presenta en su desarrollo a fin de poder procesar los datos en cualquier tarjeta gráfica con distintas especificaciones técnicas, y a su vez CUDA ofrece una completa transparencia para que los programadores no se preocupen por esos detalles. Además, el desarrollo de CUDA como lenguaje de programación a tenido un alto crecimiento a nivel que cuenta con varias librerías y APIs desarrolladas por comunidades y algunas de ellas de libre acceso para todos.

Infraestructura que respalda a la línea de investigación.

Laboratorios

  • Laboratorio de HPC de la carrera de computación. Servidor HPE Apollo con dos tarjetas GPU Tesla P100 de 16 GB cada una
  • Laboratorio de Realidad Virtual de la carrera de computación. 15 Computadoras con NVIDIA GTX 1060, procesador Intel i5-4590, 8GB de memoria RAM.
  • Laboratorio de HPC de la carrera de computación. 5 Equipos embebidos Nvidia Jetson TX2.
  • Laboratorio de Realidad Virtual de la carrera de computación. 15 Equipos Oculus Rift.

Activos

  • Activos del GIHP4C. 1 Equipo Oculus Quest
  • Activos del GIHP4C. 1. MacBookPro de procesador 2.8GHz quad core 8th generation Intel Core i7, Turbo Boost up to 4.7GHz, 16 GB de memoria Ram, 1 TB de SSD de almacenamient.
  • Activos del GIHP4C. 1. MacBook Air de procesador de doble núcleo a 1,6 GHz con Turbo Boost de hasta 3,6 GHz 128 GB de almacenamiento.
  • Activos del GIHP4C. 1 Computadora ASUS ROG G751JT-CH71 17-Inch

Bibliografía.

[1] A. Jungherr, Book Review: Social Theory after the Internet: Media, Technology and Globalization. SAGE Publications Sage CA: Los Angeles, CA, 2019, vol. 24, no. 1.
[2] G. A. León-Paredes, L. I. Barbosa-Santillán, J. J. Sánchez-Escobar, and A. Pareja-Lora, “Ship-sibiscas: A first step towards the identification of potential maritime law infringements by means of lsa-based image,” Scientific Programming, vol. 2019, 2019.
[3] T. Berners-Lee and J. Hendler, “Publishing on the semantic web,” Nature, vol. 410, no. 6832, pp. 1023–1024, 2001.
[4] G. A. León-Paredes, L. I. Barbosa-Santillán, and J. J. Sánchez-Escobar, “A Heterogeneous System Based on Latent Semantic Analysis Using GPU and Multi-CPU,” Scientific Programming, vol. 2017, p. 19, 2017.
[5] M. Graham and W. H. Dutton, “Society and the internet: How networks of information and communication are changing our lives,” Oxford University Press, 2019.
[6] V. Mayer-Schnberger and K. Cukier, “Big Data: A Revolution That Will Transform How We Live, Work, and Think,” Eamon Dolan/Houghton Mifflin Harcourt, 2014.
[7] G. Xu, Y. Zhang, and L. Li, “Web Mining and Social Networking,” Boston, MA: Springer US, 2011, pp. 1–218.
[8] T. O’Reilly, “Definition Web 2.0.,” Zugegriffen am, 2004.
[9] G. A. Veltri and G. A. Veltri, “Microblogging and nanotweets: Nanotechnology on Twitter,” Public Understanding of Science, vol. 22, no. 7, pp. 832–849, Sep. 2013.
[10] J. Jin, S. J. Turner, B.-S. Lee, J. Zhong, and B. He, “HPC Simulations of Information Propagation Over Social Networks,” Procedia – Procedia Computer Science, vol. 9, pp. 292–301, 2012.
[11] J. Nickolls and W. J. Dally, “The GPU computing era,” IEEE Micro, 2010.
[12] M. Garland, J. Nickolls, S. Le Grand, J. Anderson, J. Hardwick, S. Morton, E. Phillips, Y. Zhang, and V. Volkov, “Parallel Computing Experiences with CUDA,” IEEE Micro, vol. 28, no. 4, pp. 13–27, 2008.
[13] Nvidia, “NVIDIA Tesla P100 GPU Acelerator,” Nvidia Corporation, 2016. [En línea]. Disponible: https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/tesla-p100/pdf/nvidia-tesla-p100-PCIe-datasheet.pdf [Último acceso: 10 Marzo 2020]

 

Comentarios cerrados.