Logotipo de Zephyrnet

Extensiones de ISA y microarquitectura sobre motores de matriz densa para admitir la dispersión estructurada flexible para CPU (Georgia Tech, Intel Labs)

Fecha:

Investigadores de Georgia Tech e Intel Labs publicaron (preimpresión) un documento técnico titulado "VEGETA: extensiones integradas verticalmente para aceleración de mosaico GEMM escasa/densa en CPU".

Abstracto:

“La compatibilidad con la aceleración de aprendizaje profundo (DL) en las CPU ha cobrado mucha fuerza recientemente, con varias empresas (Arm, Intel, IBM) anunciando productos con motores de matriz especializados accesibles a través de instrucciones GEMM. Las CPU son omnipresentes y deben manejar diversos requisitos en las cargas de trabajo de DL que se ejecutan en plataformas de borde/HPC/nube. Por lo tanto, a medida que las cargas de trabajo de DL adoptan la escasez para reducir los cálculos y el tamaño de la memoria de los modelos, también es imperativo que las CPU agreguen compatibilidad con la escasez para evitar la infrautilización del motor de matriz densa y el uso ineficiente de las memorias caché y los registros. Este trabajo presenta VEGETA, un conjunto de ISA y extensiones de microarquitectura sobre motores de matriz densa para admitir la escasez estructurada flexible para CPU, lo que permite el soporte programable para diversos modelos DL con diversos grados de escasez. En comparación con el motor de matriz densa de última generación (SOTA) en las CPU, un motor VEGETA proporciona aceleraciones de 1.09x, 2.20x, 3.74x y 3.28x cuando se ejecuta 4:4 (denso), 2:4 , 1:4 y capas DNN dispersas no estructuradas (95 %).

Encuentra los documento técnico aquí. Preprint publicado en febrero de 2023.

Jeong, Geonhwa, et al. "VEGETA: extensiones integradas verticalmente para aceleración de mosaico GEMM escasa/densa en CPU". preimpresión de arXiv arXiv:2302.08687 (2023).

punto_img

Información más reciente

punto_img