Para ayudar a las organizaciones a escalar su uso de IA sin extender demasiado sus presupuestos, agregamos dos nuevas formas de reducir costos en cargas de trabajo consistentes y asincrónicas:
- Uso con descuento en rendimiento comprometido: Los clientes con un nivel sostenido de uso de tokens por minuto (TPM) en GPT-4 o GPT-4 Turbo pueden solicitar acceso al rendimiento aprovisionado para obtener descuentos que oscilan entre el 10% y el 50% según el tamaño del compromiso.
- Costos reducidos en cargas de trabajo asincrónicas: Los clientes pueden utilizar nuestro nuevo API por lotes para ejecutar cargas de trabajo no urgentes de forma asincrónica. Las solicitudes de API por lotes tienen un precio del 50% de descuento sobre los precios compartidos, ofrecen límites de tarifas mucho más altos y devuelven resultados dentro de las 24 horas. Esto es ideal para casos de uso como evaluación de modelos, clasificación fuera de línea, resumen y generación de datos sintéticos.
Planeamos seguir agregando nuevas características enfocadas en seguridad de nivel empresarial, controles administrativos y gestión de costos. Para obtener más información sobre estos lanzamientos, visite nuestro Documentación de la API or ponte en contacto con nuestro equipo para discutir soluciones personalizadas para su empresa.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
- PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
- PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
- PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
- Fuente: https://openai.com/blog/more-enterprise-grade-features-for-api-customers