Extensiones de microarquitectura e ISA sobre motores de matriz densa para admitir una escasez estructurada flexible para CPU (Georgia Tech, Intel Labs)

Investigadores de Georgia Tech e Intel Labs publicaron (preimpresión) un documento técnico titulado "VEGETA: extensiones integradas verticalmente para aceleración de mosaico GEMM escasa/densa en CPU".

Abstracto:

“La compatibilidad con la aceleración de aprendizaje profundo (DL) en las CPU ha cobrado mucha fuerza recientemente, con varias empresas (Arm, Intel, IBM) anunciando productos con motores de matriz especializados accesibles a través de instrucciones GEMM. Las CPU son omnipresentes y deben manejar diversos requisitos en las cargas de trabajo de DL que se ejecutan en plataformas de borde/HPC/nube. Por lo tanto, a medida que las cargas de trabajo de DL adoptan la escasez para reducir los cálculos y el tamaño de la memoria de los modelos, también es imperativo que las CPU agreguen compatibilidad con la escasez para evitar la infrautilización del motor de matriz densa y el uso ineficiente de las memorias caché y los registros. Este trabajo presenta VEGETA, un conjunto de ISA y extensiones de microarquitectura sobre motores de matriz densa para admitir la escasez estructurada flexible para CPU, lo que permite el soporte programable para diversos modelos DL con diversos grados de escasez. En comparación con el motor de matriz densa de última generación (SOTA) en las CPU, un motor VEGETA proporciona aceleraciones de 1.09x, 2.20x, 3.74x y 3.28x cuando se ejecuta 4:4 (denso), 2:4 , 1:4 y capas DNN dispersas no estructuradas (95 %).

Encuentra los documento técnico aquí. Preprint publicado en febrero de 2023.

Jeong, Geonhwa, et al. "VEGETA: extensiones integradas verticalmente para aceleración de mosaico GEMM escasa/densa en CPU". preimpresión de arXiv arXiv:2302.08687 (2023).

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. Accede Aquí.
Fuente: https://semiengineering.com/isa-and-microarchitecture-extensions-over-dense-matrix-engines-to-support-flexible-structured-sparsity-for-cpus-georgia-tech-intel-labs/

Inteligencia de datos generativa

Extensiones de ISA y microarquitectura sobre motores de matriz densa para admitir la dispersión estructurada flexible para CPU (Georgia Tech, Intel Labs)

Bolsa de Valores de Londres presentará listados de inversiones NFT – CryptoInfoNet

BlackRock, Fidelity y Bitwise Bitcoin ETF obtienen 205 millones de dólares de Pine Ridge Advisers de Nueva York

Información más reciente

Wisconsin se convierte en el primer estado de EE. UU. en realizar una mega inversión en ETF al contado de Bitcoin

Kenson Investments brinda a sus clientes orientación técnica personalizada en el panorama de los criptoactivos

Crypto Old-Head Otoh habla sobre Bitcoins de Casascius, paraísos fiscales y viejos amigos

La industria de las criptomonedas demuestra influencia en las elecciones del Congreso al abogar por un entorno regulatorio favorable – CryptoInfoNet

El indexador de datos Subsquid planea lanzar el token SQD el viernes

La cadena Degen vuelve a estar en línea después de una interrupción de 50 horas – The Defiant