Logotipo de Zephyrnet

Etiqueta: Inferencia de AWS

AWS Inferentia y AWS Trainium ofrecen el costo más bajo para implementar modelos Llama 3 en Amazon SageMaker JumpStart | Servicios web de Amazon

Hoy, nos complace anunciar la disponibilidad de la inferencia de Meta Llama 3 en instancias basadas en AWS Trainium y AWS Inferentia en Amazon SageMaker JumpStart....

Top News

Roadshow de IA generativa en Norteamérica con AWS y Hugging Face | Servicios web de Amazon

En 2023, AWS anunció una colaboración ampliada con Hugging Face para acelerar el recorrido de la inteligencia artificial (IA) generativa de nuestros clientes. Hugging Face, fundada en 2016,...

Gradient hace que la evaluación comparativa de LLM sea rentable y sencilla con AWS Inferentia | Servicios web de Amazon

Esta es una publicación invitada coescrita con Michael Feil en Gradient. Evaluación del rendimiento del lenguaje grande...

Ejecute inferencia de aprendizaje automático en tráfico irregular y no planificado mediante puntos finales multimodelo de Amazon SageMaker | Servicios web de Amazon

Los puntos finales multimodelo (MME) de Amazon SageMaker son una capacidad totalmente administrada de inferencia de SageMaker que le permite implementar miles de modelos en un solo...

Hable con su presentación de diapositivas utilizando modelos de base multimodal alojados en Amazon Bedrock y Amazon SageMaker – Parte 1 | Servicios web de Amazon

Con la llegada de la IA generativa, los modelos básicos (FM) actuales, como los modelos de lenguaje grande (LLM) Claude 2 y Llama 2, pueden realizar...

Ajuste e implemente modelos Llama 2 de manera rentable en Amazon SageMaker JumpStart con AWS Inferentia y AWS Trainium | Servicios web de Amazon

Hoy, nos complace anunciar la disponibilidad de la inferencia de Llama 2 y el soporte de ajuste en instancias de AWS Trainium y AWS Inferentia en Amazon SageMaker...

Ajuste Llama 2 usando QLoRA e impleméntelo en Amazon SageMaker con AWS Inferentia2 | Servicios web de Amazon

En esta publicación, mostramos el ajuste de un modelo Llama 2 utilizando un método de ajuste fino con eficiencia de parámetros (PEFT) e implementamos el modelo ajustado en AWS Inferentia2....

Flujos de trabajo RAG y generación aumentada de recuperación

IntroducciónLa generación aumentada de recuperación, o RAG, es un mecanismo que ayuda a que los modelos de lenguaje grandes (LLM) como GPT se vuelvan más útiles y conocedores al incorporar...

Entrene e implemente modelos de aprendizaje automático en un entorno multinube mediante Amazon SageMaker | Servicios web de Amazon

A medida que los clientes aceleran sus migraciones a la nube y transforman su negocio, algunos se encuentran en situaciones en las que tienen que gestionar las operaciones de TI...

Aprendizaje automático con datos de capacitación descentralizados mediante aprendizaje federado en Amazon SageMaker | Servicios web de Amazon

El aprendizaje automático (ML) está revolucionando las soluciones en todas las industrias e impulsando nuevas formas de conocimientos e inteligencia a partir de datos. Muchos algoritmos de ML se entrenan en grandes...

Cree un backend de resumen de reuniones sin servidor con grandes modelos de lenguaje en Amazon SageMaker JumpStart | Servicios web de Amazon

AWS ofrece servicios que satisfacen las necesidades de inteligencia artificial (IA) y aprendizaje automático (ML) de los clientes con servicios que van desde hardware personalizado como AWS Trainium y...

Logre un alto rendimiento con el costo más bajo para la inferencia de IA generativa con AWS Inferentia2 y AWS Trainium en Amazon SageMaker

El mundo de la inteligencia artificial (IA) y el aprendizaje automático (ML) ha sido testigo de un cambio de paradigma con el auge de los modelos generativos de IA que...

Cómo Sportradar usó Deep Java Library para crear plataformas de aprendizaje automático a escala de producción para aumentar el rendimiento y la eficiencia

Esta es una publicación de invitado coescrita con Fred Wu de Sportradar. Sportradar es la empresa de tecnología deportiva líder en el mundo, en la intersección entre deportes,...

Información más reciente

punto_img
punto_img