Etiqueta: Inferencia de AWS

AWS Inferentia y AWS Trainium ofrecen el costo más bajo para implementar modelos Llama 3 en Amazon SageMaker JumpStart | Servicios web de Amazon

AI 2 de mayo de 2024

Hoy, nos complace anunciar la disponibilidad de la inferencia de Meta Llama 3 en instancias basadas en AWS Trainium y AWS Inferentia en Amazon SageMaker JumpStart....

Guía sencilla para entrenar Llama 2 con AWS Trainium en Amazon SageMaker | Servicios web de Amazon

AI 1 de mayo de 2024

Desarrolle y entrene modelos grandes de manera rentable con Metaflow y AWS Trainium | Servicios web de Amazon

AI Abril 29, 2024

AWS y Mistral AI se comprometen a democratizar la IA generativa con una colaboración reforzada | Servicios web de Amazon

AI Abril 3, 2024

Roadshow de IA generativa en Norteamérica con AWS y Hugging Face | Servicios web de Amazon

AIAbril 2, 2024

En 2023, AWS anunció una colaboración ampliada con Hugging Face para acelerar el recorrido de la inteligencia artificial (IA) generativa de nuestros clientes. Hugging Face, fundada en 2016,...

Gradient hace que la evaluación comparativa de LLM sea rentable y sencilla con AWS Inferentia | Servicios web de Amazon

AIAbril 2, 2024

Esta es una publicación invitada coescrita con Michael Feil en Gradient. Evaluación del rendimiento del lenguaje grande...

Ejecute inferencia de aprendizaje automático en tráfico irregular y no planificado mediante puntos finales multimodelo de Amazon SageMaker | Servicios web de Amazon

AIFebrero 19, 2024

Los puntos finales multimodelo (MME) de Amazon SageMaker son una capacidad totalmente administrada de inferencia de SageMaker que le permite implementar miles de modelos en un solo...

Hable con su presentación de diapositivas utilizando modelos de base multimodal alojados en Amazon Bedrock y Amazon SageMaker – Parte 1 | Servicios web de Amazon

AIEnero 30, 2024

Con la llegada de la IA generativa, los modelos básicos (FM) actuales, como los modelos de lenguaje grande (LLM) Claude 2 y Llama 2, pueden realizar...

Ajuste e implemente modelos Llama 2 de manera rentable en Amazon SageMaker JumpStart con AWS Inferentia y AWS Trainium | Servicios web de Amazon

AIEnero 17, 2024

Hoy, nos complace anunciar la disponibilidad de la inferencia de Llama 2 y el soporte de ajuste en instancias de AWS Trainium y AWS Inferentia en Amazon SageMaker...

Ajuste Llama 2 usando QLoRA e impleméntelo en Amazon SageMaker con AWS Inferentia2 | Servicios web de Amazon

AI13 de diciembre de 2023

En esta publicación, mostramos el ajuste de un modelo Llama 2 utilizando un método de ajuste fino con eficiencia de parámetros (PEFT) e implementamos el modelo ajustado en AWS Inferentia2....

Flujos de trabajo RAG y generación aumentada de recuperación

AI24 de Octubre de 2023

IntroducciónLa generación aumentada de recuperación, o RAG, es un mecanismo que ayuda a que los modelos de lenguaje grandes (LLM) como GPT se vuelvan más útiles y conocedores al incorporar...

Entrene e implemente modelos de aprendizaje automático en un entorno multinube mediante Amazon SageMaker | Servicios web de Amazon

AI20 de septiembre de 2023

A medida que los clientes aceleran sus migraciones a la nube y transforman su negocio, algunos se encuentran en situaciones en las que tienen que gestionar las operaciones de TI...

Aprendizaje automático con datos de capacitación descentralizados mediante aprendizaje federado en Amazon SageMaker | Servicios web de Amazon

AI22 de agosto de 2023

El aprendizaje automático (ML) está revolucionando las soluciones en todas las industrias e impulsando nuevas formas de conocimientos e inteligencia a partir de datos. Muchos algoritmos de ML se entrenan en grandes...

Cree un backend de resumen de reuniones sin servidor con grandes modelos de lenguaje en Amazon SageMaker JumpStart | Servicios web de Amazon

AI17 de mayo de 2023

AWS ofrece servicios que satisfacen las necesidades de inteligencia artificial (IA) y aprendizaje automático (ML) de los clientes con servicios que van desde hardware personalizado como AWS Trainium y...

Logre un alto rendimiento con el costo más bajo para la inferencia de IA generativa con AWS Inferentia2 y AWS Trainium en Amazon SageMaker

AI4 de mayo de 2023

El mundo de la inteligencia artificial (IA) y el aprendizaje automático (ML) ha sido testigo de un cambio de paradigma con el auge de los modelos generativos de IA que...

Cómo Sportradar usó Deep Java Library para crear plataformas de aprendizaje automático a escala de producción para aumentar el rendimiento y la eficiencia

AIAbril 19, 2023

Esta es una publicación de invitado coescrita con Fred Wu de Sportradar. Sportradar es la empresa de tecnología deportiva líder en el mundo, en la intersección entre deportes,...

12 Página 1 de 2

Información más reciente

Anuncio de nuevas herramientas para compilar con IA generativa en AWS

AI Abril 13, 2023

Implemente modelos de lenguaje grandes en AWS Inferentia2 utilizando contenedores de inferencia de modelos grandes

AI Abril 10, 2023

Maximice el rendimiento y reduzca el costo de la capacitación en aprendizaje profundo con AWS Trainium y Amazon SageMaker

AI Marzo 14, 2023

Exafunction es compatible con AWS Inferentia para desbloquear el mejor rendimiento de precio para la inferencia de aprendizaje automático

AI 8 de diciembre de 2022

Inteligencia de datos generativa