Nvidia presenta GPU para estaciones de trabajo pequeñas y que consumen mucha energía

Nvidia amplió su cartera de GPU el lunes con una pequeña tarjeta para estación de trabajo que, según afirma, ofrece una mejora considerable en el rendimiento y al mismo tiempo consume energía, en términos relativos.

Con 2,816 núcleos CUDA y 16 GB de memoria GDDR6 ECC, el RTX 2000 Ada Puede que no sea el chip para estaciones de trabajo más potente de Nvidia, pero su factor de forma de media altura y doble ranura lo convierte en uno de los más pequeños basados en la microarquitectura Ada Lovelace de Nvidia.

Esta no es la primera vez que vemos este factor de forma de Nvidia. El RTX A12 de 2000 GB del GPU Slinger, que debutó en 2021, presentaba un diseño similar de estilo soplador que podía caber en algunos sistemas realmente pequeños, como el de HP. Z2 G9 Mini.

Si bien la actualización de Ada mantiene el mismo presupuesto de energía de 70 W que su predecesora, Nvidia afirma que la nueva tarjeta es aproximadamente un 30 por ciento más rápida en cargas de trabajo de gráficos y hasta un 50 por ciento más rápida en una variedad de cargas de trabajo de renderizado e inteligencia artificial, como el modelo de generación de imágenes de difusión estable. .

En términos de rendimiento bruto, Nvidia promociona la tarjeta como capaz de exprimir alrededor de 12 teraFLOPS con precisión simple o alrededor de 192 teraFLOPS de FP8 escaso de su GPU AD107.

Si ese troquel le suena familiar, es el mismo que se usa en las GPU para juegos Nvidia RTX 299 de $ 4060, que miró la primavera pasada. No es raro que Nvidia (o la mayoría de las casas de chips) reciclen matrices para usarlas en múltiples familias de productos, cambiando la configuración de la memoria y/o habilitando/deshabilitando funciones para crear diferenciación. Por ejemplo, la L40 de Nvidia utiliza el misma GPU muere como el RTX 4090.

Es una historia similar para el RTX 2000 Ada, que además de ser mucho más pequeño que el RTX 4060, cuenta con el doble de memoria y un TDP mucho más bajo, lo que le permite funcionar completamente desde la ranura PCIe. La RTX 2000 Ada tiene menos núcleos CUDA y presumiblemente velocidades de reloj más bajas, sin embargo, la tarjeta no está diseñada pensando en los juegos.

En cambio, la línea de estaciones de trabajo RTX de Nvidia, lo que solía llamar sus GPU Quadro, está certificada para su uso con cargas de trabajo profesionales, como Solidworks, y por eso incluye elementos como la memoria ECC.

Hablando de memoria, el búfer de cuadros más grande del RTX 2000 Ada también debería ser útil para quienes aumentan sus cargas de trabajo creativas o de diseño con modelos generativos de IA. Con 16 GB de vRAM a bordo, la tarjeta debería poder acomodar fácilmente 13 mil millones de modelos de parámetros en el FP8 y potencialmente incluso modelos más grandes al aprovechar técnicas como la cuantificación.

Dicho esto, el bus de memoria de 128 bits de la tarjeta podría resultar algo limitante en términos de rendimiento. Puedes ver la hoja de especificaciones completa esta página.

Pero, si lo único que busca es más memoria para ejecutar modelos de lenguaje grandes localmente, existen opciones más baratas y/o de mayor rendimiento, especialmente si puede prescindir de las funciones de estación de trabajo de Nvidia. Las tarjetas gráficas RTX 4070 TI Super de Nvidia y RX 7600XT de AMD, que lanzado en CES el mes pasado, también cuentan con 16 GB de DRAM. Este último se puede conseguir por $329, lo que lo hace considerablemente más barato que el RTX 2000 Ada a $625.

Si está buscando una pequeña tarjeta de estación de trabajo con exceso de vRAM, entonces la RTX 2000 Ada ya está disponible en una variedad de socios de placas Nvidia, incluidos Arrow Electronics, PNY e Ingram Micro. La tarjeta también se venderá en estaciones de trabajo prefabricadas de HP, Dell Tech y Lenovo a partir de abril. ®

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
Fuente: https://go.theregister.com/feed/www.theregister.com/2024/02/12/nvidia_workstation_gpu/

Inteligencia de datos generativa

Nvidia presenta una pequeña GPU para estaciones de trabajo que consume mucha energía

Esta vez es diferente, la caída de BTC no es causada por una pérdida de apalancamiento: analista

La volatilidad del tipo de cambio afecta los ingresos del primer trimestre de Compagnie Financière Tradition

Información más reciente

Mode Network lanza campaña de lanzamiento aéreo en Ethereum Layer 2 | BitPinas

RWA en foco: Propine, custodio de activos digitales regulado por MAS, presenta soporte para Fathom Dollar $FXD Stablecoin en la red XDC

RWA en foco: Propine, custodio de activos digitales regulado por MAS, presenta soporte para Fathom Dollar $FXD Stablecoin en la red XDC

Robinhood se asocia con Uniswap para simplificar las compras de criptomonedas para usuarios de EE. UU.

MicroStrategy está creando una 'identificación descentralizada' en Bitcoin utilizando inscripciones similares a ordinales – Decrypt

Pike Finance admite haber cometido un error tras un exploit de 1.7 millones de dólares y niega la culpa del USDC