Logotipo de Zephyrnet

Presentamos tres nuevas instancias Amazon EC2 basadas en GPU NVIDIA | Servicios web de Amazon

Fecha:

Nube informática elástica de Amazon (Amazon EC2) ofrece la más amplia variedad de aceleradores para impulsar sus cargas de trabajo de inteligencia artificial (IA), aprendizaje automático (ML), gráficos y computación de alto rendimiento (HPC). Nos complace anunciar la expansión de este portafolio con tres nuevas instancias que cuentan con las GPU NVIDIA más recientes: instancias Amazon EC2 P5e con tecnología de GPU NVIDIA H200, instancias Amazon EC2 G6 con GPU NVIDIA L4 e instancias Amazon EC2 G6e con tecnología de GPU NVIDIA L40S. Las tres instancias estarán disponibles en 2024 y esperamos ver qué puedes hacer con ellas.

AWS y NVIDIA han colaborado durante más de 13 años y han sido pioneros en soluciones basadas en GPU a gran escala, de alto rendimiento y rentables para desarrolladores y empresas de todo el espectro. Hemos combinado las potentes GPU de NVIDIA con tecnologías diferenciadas de AWS como Sistema Nitro de AWS, 3,200 Gbps de Adaptador de tela elástica (EFA) v2 en red, cientos de GB/s de rendimiento de datos con Amazon FSx para Lustrey computación a exaescala con Amazon EC2 UltraClusters para ofrecer la infraestructura de mayor rendimiento para AI/ML, gráficos y HPC. Junto con otros servicios gestionados como lecho rocoso del amazonas, Amazon SageMakery Servicio Amazon Elastic Kubernetes (Amazon EKS), estas instancias brindan a los desarrolladores la mejor plataforma de la industria para crear e implementar aplicaciones gráficas, HPC y de IA generativa.

Instancias basadas en GPU rentables y de alto rendimiento para cargas de trabajo de IA, HPC y gráficos

Para impulsar el desarrollo, el entrenamiento y la inferencia de los modelos de lenguajes grandes (LLM) más grandes, las instancias EC2 P5e contarán con las últimas GPU H200 de NVIDIA, que ofrecen 141 GB de memoria de GPU HBM3e, que es 1.7 veces más grande y 1.4 veces más rápida que las GPU H100. . Este aumento en la memoria de la GPU junto con hasta 3200 Gbps de red EFA habilitada por AWS Nitro System le permitirá continuar construyendo, entrenando e implementando sus modelos de vanguardia en AWS.

Las instancias EC2 G6e, con GPU NVIDIA L40S, están diseñadas para brindar a los desarrolladores una opción ampliamente disponible para la capacitación e inferencia de LLM disponibles públicamente, así como para respaldar la creciente adopción de modelos de lenguaje pequeño (SLM). También son óptimos para aplicaciones de gemelos digitales que utilizan NVIDIA Omniverse para describir y simular herramientas y aplicaciones 3D, y para crear mundos virtuales y flujos de trabajo avanzados para la digitalización industrial.

Las instancias EC2 G6, con GPU NVIDIA L4, ofrecerán una solución de menor costo y eficiencia energética para implementar modelos de aprendizaje automático para procesamiento de lenguaje natural, traducción de idiomas, análisis de imágenes y videos, reconocimiento de voz y personalización, así como cargas de trabajo de gráficos, como crear y renderizar gráficos en tiempo real con calidad cinematográfica y transmisión de juegos.


Sobre la autora

chetan kapoor es el director de gestión de productos de la cartera de computación acelerada de Amazon EC2.

punto_img

Información más reciente

punto_img