Logotipo de Zephyrnet

Entrene un modelo de pronóstico de series temporales más rápido con Amazon SageMaker Canvas Quick build

Fecha:

Hoy, Lienzo de Amazon SageMaker introduce la capacidad de usar la función de compilación rápida con casos de uso de pronóstico de series temporales. Esto le permite entrenar modelos y generar las puntuaciones de explicabilidad asociadas en menos de 20 minutos, momento en el que puede generar predicciones sobre datos nuevos e invisibles. El entrenamiento de compilación rápida permite una experimentación más rápida para comprender qué tan bien se ajusta el modelo a los datos y qué columnas impulsan la predicción, y permite a los analistas de negocios ejecutar experimentos con conjuntos de datos variados para que puedan seleccionar el modelo de mejor rendimiento.

Canvas amplía el acceso al aprendizaje automático (ML) al proporcionar a los analistas de negocios una interfaz visual de apuntar y hacer clic que le permite generar predicciones de ML precisas por su cuenta, sin necesidad de experiencia en ML ni tener que escribir una sola línea de código.

En esta publicación, mostramos cómo entrenar un modelo de pronóstico de series de tiempo más rápido con el entrenamiento de compilación rápida en Canvas.

Resumen de la solución

Hasta hoy, el entrenamiento de un modelo de pronóstico de series temporales tomaba hasta 4 horas a través del método de compilación estándar. Aunque ese enfoque tiene la ventaja de priorizar la precisión sobre el tiempo de capacitación, esto conducía con frecuencia a largos tiempos de capacitación, lo que a su vez no permitía la experimentación rápida que los analistas de negocios de todo tipo de organizaciones suelen buscar. A partir de hoy, Canvas le permite emplear la función de compilación rápida para entrenar un modelo de pronóstico de series temporales, lo que se suma a los casos de uso para los que ya estaba disponible (clasificación binaria y multiclase y regresión numérica). Ahora puede entrenar un modelo y obtener información de explicabilidad en menos de 20 minutos, con todo en su lugar para comenzar a generar inferencias.

Para usar la función de compilación rápida para los casos de uso de ML de pronóstico de series temporales, todo lo que necesita hacer es cargar su conjunto de datos en Canvas, configurar los parámetros de entrenamiento (como la columna objetivo) y luego elegir Construcción rápida en lugar de Construcción estándar (que era la única opción disponible para este tipo de caso de uso de ML antes de hoy). Tenga en cuenta que la compilación rápida solo está disponible para conjuntos de datos con menos de 50,000 XNUMX filas.

Analicemos un escenario de aplicación de la función de compilación rápida a un caso de uso de ML del mundo real que involucre datos de series temporales y obtenga resultados procesables.

Crear una compilación rápida en Canvas

Cualquiera que haya trabajado con ML, incluso si no posee experiencia o conocimientos relevantes, sabe que el resultado final es tan bueno como el conjunto de datos de entrenamiento. No importa qué tan bien se ajuste el algoritmo que usó para entrenar el modelo, el resultado final reflejará la calidad de la inferencia en datos no vistos, y no será satisfactorio si los datos de entrenamiento no son indicativos del dado. caso de uso, está sesgado o tiene valores faltantes frecuentes.

A los efectos de esta publicación, utilizamos un conjunto de datos sintéticos de muestra que contiene información sobre la demanda y los precios de varios artículos en un período de tiempo determinado, especificado con una marca de tiempo (un campo de fecha en el archivo CSV). El conjunto de datos está disponible en GitHub. La siguiente captura de pantalla muestra las primeras diez filas.

Resolver un problema empresarial usando ML sin código con Canvas es un proceso de cuatro pasos: importar el conjunto de datos, crear el modelo de ML, verificar su rendimiento y luego usar el modelo para generar predicciones (también conocido como inferencia en la terminología de ML). Si es nuevo en Canvas, aparecerá un mensaje que lo guiará a través del proceso. Siéntase libre de pasar un par de minutos con el tutorial en la aplicación si lo desea, de lo contrario, puede elegir Saltar por ahora. También hay un dedicado Guía de inicio puede seguir para sumergirse completamente en el servicio si desea una introducción más detallada.

Comenzamos cargando el conjunto de datos. Complete los siguientes pasos:

  1. En Conjuntos de datos página, elige Datos de importacion.
  2. Subir datos de disco local u otras fuentes, Tales como Servicio de almacenamiento simple de Amazon (Amazon S3), Desplazamiento al rojo de Amazony Copo de nieve, para cargar el conjunto de datos de muestra. product_demand.csv ahora se muestra en la lista de conjuntos de datos.
  3. Abierto product_demand.csv y elige Crea un modelo para iniciar el proceso de creación del modelo.
    Eres redirigido a Construcción pestaña de la aplicación Canvas para iniciar el siguiente paso del flujo de trabajo de Canvas.
  4. Primero, seleccionamos la variable objetivo, el valor que estamos tratando de predecir como una función de las otras variables disponibles en el conjunto de datos. En nuestro caso, ese es el demand variable.
    Canvas infiere automáticamente que se trata de un problema de pronóstico de series de tiempo.
    Para que Canvas resuelva el caso de uso de pronóstico de series temporales, debemos configurar un par de opciones de configuración.
  5. Especifique qué columna identifica de forma única los elementos en el conjunto de datos, dónde se almacenan las marcas de tiempo y el horizonte de predicciones (cuántos meses en el futuro queremos mirar).
  6. Además, podemos proporcionar un cronograma de días festivos, que puede ser útil en algunos casos de uso que se benefician de tener esta información, como casos de uso minorista o de la cadena de suministro.
  7. Elige Guardar.

    Elegir el horizonte de predicción correcto es de suma importancia para un buen caso de uso de pronóstico de series temporales. Cuanto mayor sea el valor, más hacia el futuro generaremos la predicción; sin embargo, es menos probable que sea precisa debido a la naturaleza probabilística del pronóstico generado. Un valor más alto también significa más tiempo para entrenar, así como más recursos necesarios tanto para el entrenamiento como para la inferencia. Finalmente, es una buena práctica tener puntos de datos del pasado al menos 3 a 5 veces el horizonte de pronóstico. Si desea predecir 6 meses en el futuro (como en nuestro ejemplo), debe tener al menos 18 meses de datos históricos, hasta 30 meses.
  8. Después de proteger estas configuraciones, elija Construcción rápida.

Canvas lanza un proceso AutoML en memoria que entrena múltiples modelos de pronóstico de series temporales con diferentes hiperparámetros. En menos de 20 minutos (según el conjunto de datos), Canvas generará el mejor rendimiento del modelo en forma de cinco métricas.

Profundicemos en las métricas avanzadas para los pronósticos de series de tiempo en Canvas y cómo podemos darles sentido:

  • Pérdida cuantil media ponderada (wQL) – Evalúa el pronóstico promediando la precisión en los cuantiles P10, P50 y P90. Un valor más bajo indica un modelo más preciso.
  • Error porcentual absoluto ponderado (WAPE) – La suma del error absoluto normalizado por la suma del objetivo absoluto, que mide la desviación general de los valores pronosticados de los valores observados. Un valor más bajo indica un modelo más preciso, donde WAPE = 0 es un modelo sin errores.
  • Error cuadrático medio (RMSE) – La raíz cuadrada de los errores cuadrados promedio. Un RMSE más bajo indica un modelo más preciso, donde RMSE = 0 es un modelo sin errores.
  • Error porcentual absoluto medio (MAPE) – El porcentaje de error (diferencia porcentual del valor medio pronosticado frente al valor real) promediado en todos los puntos de tiempo. Un valor más bajo indica un modelo más preciso, donde MAPE = 0 es un modelo sin errores.
  • Error escalado absoluto medio (MASE) – El error absoluto medio del pronóstico normalizado por el error absoluto medio de un método de pronóstico de línea de base simple. Un valor más bajo indica un modelo más preciso, donde se estima que MASE 1 es peor que la línea de base.

Para obtener más información acerca de las métricas avanzadas, consulte Utilice métricas avanzadas en sus análisis.

La explicabilidad incorporada es parte de la propuesta de valor de Canvas, ya que proporciona información sobre el impacto de la columna en el Analizar pestaña. En este caso de uso, podemos ver que el precio tiene un gran impacto en el valor de la demanda. Esto tiene sentido porque un precio muy bajo aumentaría la demanda por un amplio margen.

Predicciones y escenarios hipotéticos

Después de analizar el rendimiento de nuestro modelo, podemos usarlo para generar predicciones y probar escenarios hipotéticos.

  1. En Predicción pestaña, elegir El solo artículo.
  2. Elija un elemento (para este ejemplo, item_002).

La siguiente captura de pantalla muestra el pronóstico para item_002.

Podemos esperar un aumento de la demanda en los próximos meses. Canvas también proporciona un umbral probabilístico alrededor del pronóstico esperado, por lo que podemos decidir si tomamos el límite superior de la predicción (con riesgo de sobreasignación) o el límite inferior (con riesgo de subasignación). Utilice estos valores con precaución y aplique su conocimiento del dominio para determinar la mejor predicción para su negocio.

Canvas también admite escenarios hipotéticos, lo que hace posible ver cómo los valores cambiantes en el conjunto de datos pueden afectar el pronóstico general para un solo elemento, directamente en el gráfico de pronóstico. Para los propósitos de esta publicación, simulamos una campaña de 2 meses en la que presentamos un descuento del 50 %, reduciendo el precio de $120 a $60.

  1. Elige Qué pasaría si el escenario.
  2. Elija los valores que desea cambiar (para este ejemplo, noviembre y diciembre).
  3. Elige Generar predicción.

    Podemos ver que el precio modificado introduce un pico con la demanda del producto durante los meses afectados por la campaña de descuento y luego vuelve lentamente a los valores esperados del pronóstico anterior.
    Como prueba final, podemos determinar el impacto de cambiar definitivamente el precio de un producto.
  4. Elige Pruebe un nuevo escenario hipotético.
  5. Seleccione Edición masiva de todos los valores.
  6. Nuevo valor, ingrese 70.
  7. Elige Generar predicción.

Este es un precio más bajo que los $100–120 iniciales, por lo tanto, esperamos un fuerte aumento en la demanda del producto. Esto lo confirma el pronóstico, como se muestra en la siguiente captura de pantalla.

Limpiar

Para evitar incurrir en el futuro cargos de sesión, cierre la sesión de SageMaker Canvas.

Conclusión

En esta publicación, lo guiamos a través de la función de compilación rápida para modelos de pronóstico de series temporales y la vista de análisis de métricas actualizada. Ambos están disponibles a partir de hoy en todas las regiones donde Canvas está disponible. Para obtener más información, consulte Construir un modelo y Utilice métricas avanzadas en sus análisis.

Para obtener más información sobre Canvas, consulte estos enlaces:

Para obtener más información sobre otros casos de uso que puede resolver con Canvas, consulte las siguientes publicaciones:

Comience a experimentar con Canvas hoy y cree sus modelos de pronóstico de series de tiempo en menos de 20 minutos, utilizando el Nivel gratuito de 2 meses que ofrece Canvas.


Acerca de los autores

david gallitelli es Arquitecto de Soluciones Especializado en IA/ML en la región EMEA. Tiene su sede en Bruselas y trabaja en estrecha colaboración con los clientes en todo el Benelux. Ha sido desarrollador desde que era muy joven, comenzó a programar a la edad de 7 años. Comenzó a aprender AI/ML en la universidad y se enamoró de él desde entonces.

Nikiforos Botis es arquitecto de soluciones en AWS, se ocupa del sector público de Grecia y Chipre, y es miembro de la comunidad técnica de IA/ML de AWS. Le gusta trabajar con los clientes en la arquitectura de sus aplicaciones de una manera resiliente, escalable, segura y rentable.

punto_img

Información más reciente

punto_img