Transporte continuo de partículas de energía Monte Carlo en aceleradores de HW de IA

Investigadores del Laboratorio Nacional Argonne, la Universidad de Chicago y Cerebras Systems publicaron un artículo técnico titulado “Algoritmos eficientes para el transporte de partículas de Monte Carlo en hardware de acelerador de IA”.

Abstracto:

“La reciente tendencia hacia el aprendizaje profundo ha llevado al desarrollo de una variedad de arquitecturas de aceleradores de IA altamente innovadoras. Una de esas arquitecturas, Cerebras Wafer-Scale Engine 2 (WSE-2), cuenta con 40 GB de SRAM en el chip, lo que la convierte en una plataforma potencialmente atractiva para cargas de trabajo de simulación HPC con latencia o ancho de banda. En este estudio, examinamos la viabilidad de realizar un transporte continuo de partículas Monte Carlo (MC) de energía en el WSE-2 transfiriendo un núcleo clave del algoritmo de transporte MC al modelo de programación CSL de Cerebras. Se desarrollan y prueban nuevos algoritmos para minimizar los costos de comunicación y manejar el equilibrio de carga. Se ha descubierto que el WSE-2 se ejecuta 130 veces más rápido que una versión CUDA altamente optimizada del kernel ejecutada en una GPU NVIDIA A100, superando significativamente el aumento de rendimiento esperado dada la diferencia en el número de transistores entre las arquitecturas”.

Encuentra los documento técnico aquí. Publicado en noviembre de 2023 (preimpresión).

Tramm, John, Bryce Allen, Kazutomo Yoshii, Andrew Siegel y Leighton Wilson. "Algoritmos eficientes para el transporte de partículas de Monte Carlo en hardware de acelerador de IA". Preimpresión de arXiv arXiv:2311.01739 (2023).

Lectura relacionada
Procesadores de partición para cargas de trabajo de IA
El procesamiento de propósito general y la falta de flexibilidad están lejos de ser ideales para cargas de trabajo de IA/ML.
Compensaciones de procesador para cargas de trabajo de IA
Las brechas entre los avances y las demandas tecnológicas se están ampliando, y cerrarlas es cada vez más difícil.
Especialización vs. Generalización en procesadores
¿Qué se necesitará para lograr una personalización masiva en el borde, con alto rendimiento y bajo consumo?

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
Fuente: https://semiengineering.com/continuous-energy-monte-carlo-particle-transport-on-ai-hw-accelerators/

Inteligencia de datos generativa

Transporte continuo de partículas de energía Monte Carlo en aceleradores AI HW

Abstracto:

Volando en el Air Koryo de Corea del Norte

Títulos especiales austriacos “Sí a Europa” 2024

Información más reciente

Tesla lanza una tasa de préstamo APR del 0.99% por tiempo limitado para pedidos del Model Y de EE. UU.

Ford reduce los pedidos de baterías ya que pierde más de 100,000 dólares por vehículo eléctrico vendido

Lista de observación de prospectos del draft de la NFL 2025: seguridades

Broadleaf Commerce se enorgullece de anunciar el lanzamiento de Microservicios 2.1

El Boeing 777 de KLM realiza un aterrizaje de emergencia en Ankara tras una indicación de incendio en la carga

BlockDAG presenta la versión número 26 de desarrollo para reforzar la red y lograr una escalabilidad mejorada con $100 millones en liquidez