Logotipo de Zephyrnet

Presentamos más funciones de nivel empresarial para clientes de API

Fecha:

Para ayudar a las organizaciones a escalar su uso de IA sin extender demasiado sus presupuestos, agregamos dos nuevas formas de reducir costos en cargas de trabajo consistentes y asincrónicas:

  • Uso con descuento en rendimiento comprometido: Los clientes con un nivel sostenido de uso de tokens por minuto (TPM) en GPT-4 o GPT-4 Turbo pueden solicitar acceso al rendimiento aprovisionado para obtener descuentos que oscilan entre el 10% y el 50% según el tamaño del compromiso.
  • Costos reducidos en cargas de trabajo asincrónicas: Los clientes pueden utilizar nuestro nuevo API por lotes para ejecutar cargas de trabajo no urgentes de forma asincrónica. Las solicitudes de API por lotes tienen un precio del 50% de descuento sobre los precios compartidos, ofrecen límites de tarifas mucho más altos y devuelven resultados dentro de las 24 horas. Esto es ideal para casos de uso como evaluación de modelos, clasificación fuera de línea, resumen y generación de datos sintéticos.


Planeamos seguir agregando nuevas características enfocadas en seguridad de nivel empresarial, controles administrativos y gestión de costos. Para obtener más información sobre estos lanzamientos, visite nuestro Documentación de la API or ponte en contacto con nuestro equipo para discutir soluciones personalizadas para su empresa.

punto_img

café vc

café vc

Información más reciente

punto_img