Logotipo de Zephyrnet

Cree pronósticos y encuentre anomalías en sus datos con Amazon QuickSight ML Insights

Fecha:

A medida que avanza la tecnología, su empresa recopila cada vez más datos de diferentes fuentes. Después de recopilar tantos puntos de datos, a menudo es difícil encontrar la información adecuada para ayudar a que su negocio crezca. Los paneles son excelentes para visualizar sus datos, en función de cómo los construyó, pero no siempre son excelentes para encontrar información oculta, como anomalías o valores atípicos de sus datos. Ayudan a las personas a encontrar datos, pero no a encontrar personas. A medida que se escala su recopilación de datos, debe cambiar de la primera a la posterior para evitar el recuento de escala. Es posible que su empresa no tenga el tiempo o los recursos para ver más que tendencias de alto nivel, o solo puede obtener información profunda de un pequeño subconjunto de datos.

Estas limitaciones pueden dificultar su capacidad de tomar decisiones comerciales informadas. Amazon QuickSight tiene una detección de anomalías incorporada, potenciada por el aprendizaje automático (ML), que puede ayudarlo a ahorrar tiempo y recursos en tareas de creación, capacitación, ajuste de hiperparámetros, inferencia e implementación de modelos de ML. También obtiene información detallada de millones de métricas y miles de millones de puntos de datos a escala.

Esta publicación lo guía a través de cómo usar Perspectivas de aprendizaje automático para crear visualizaciones y pronósticos útiles. El tutorial utiliza los siguientes servicios de AWS:

  • Amazon QuickSight para construir los conocimientos y la visualización de ML
  • Atenea amazónica para consultar el conjunto de datos de Amazon QuickSight para el análisis manual de datos.
  • Pegamento AWS rastrear el conjunto de datos y preparar metadatos sin cargarlo en el anuncio Esto reduce el costo de ejecutar una base de datos costosa; puede almacenar y ejecutar imágenes de archivos de datos sin procesar almacenados en un depósito S3 económico, altamente escalable y duradero.
  • Amazon S3 para almacenar la fuente de datos.

Preparando su conjunto de datos

Para comenzar, debe recopilar, limpiar y preparar sus conjuntos de datos para Amazon QuickSight. Esta publicación usa Amazon S3 como fuente de datos, pero puede usar cualquier fuente de datos compatible con Quicksight que tengamos como Redshift, Athena, RDS, Aurora, MySQL, Postgres, MariaDB y más para consultar y construir su visualización. Esta publicación utiliza tres conjuntos de datos:

Las visualizaciones en esta publicación son de después de limpiar los datos, cambiar el tipo de datos y filtrar los datos para reflejar las dimensiones requeridas para el caso de uso dado.

Para preparar su conjunto de datos de ventas de supermercados, complete los siguientes pasos:

  1. En la consola AWS S3, cree un depósito S3 seleccionando Crea un cubo.
  2. Para el nombre del depósito, proporcione un nombre adecuado y seleccione la región donde desea construir su visualización y seleccione Crear cubo.
  3. Descargue el conjunto de datos públicos en su máquina local.
  4. Seleccione el cubo S3 y elija Subir, navegue al archivo de conjunto de datos descargado en su máquina local.
  5. Seleccione el archivo de conjunto de datos y elija Subir.
  6. En la consola de AWS Glue, cree un rastreador que se ejecute en un archivo CSV para preparar los metadatos.
  7. Nombre del rastreador, ingrese un nombre para su rastreador; por ejemplo, sales-data.
  8. Elige Siguiente.
  9. En Agregar un almacén de datos sección, para Elige un almacén de datos, escoger S3.
  10. Rastrear datos en, seleccione Ruta especificada en mi cuenta.
  11. Incluir ruta, ingrese la ruta a su bucket S3. Puede incluir múltiples almacenes de datos si los tiene.
  12. Elige Siguiente.
  13. En Elija un rol de IAM sección, seleccionar Crear un rol de IAM.
  14. AMI función, ingrese la función que AWS Glue necesita para acceder a Amazon S3.
  15. Elige Siguiente.
  16. En Crea un horario para este rastreador sección, para Frecuencia, elija cuándo desea que el rastreador se ejecute en sus datos. Para esta publicación, elija Ejecutar bajo demanda.

    Esto le brinda la flexibilidad de decidir con qué frecuencia desea que las actualizaciones del conjunto de datos se reflejen en sus metadatos.
  17. En Configurar la salida del rastreador sección, para Base de datos, elija la base de datos que contiene la tabla que usará el rastreador.
  18. Elige Siguiente.
  19. Después de crear el rastreador, elija Ejecutar rastreadorEl rastreador puede tardar unos minutos antes de que se complete.
  20. En la consola de AWS Glue, debajo de Bases de datos, escoger Mesas.
  21. Elija la base de datos que creó.
  22. Elige Ver tabla.
  23. Desde el la columna Acción menú desplegable, elija Ver datos.

    Este paso te lleva a la consola Athena. Athena le brinda la flexibilidad de ejecutar consultas únicas para analizar sus datos manualmente cuando lo necesite. Por ejemplo, puede verificar qué miembros de la línea de productos prefieren comprar con una tarjeta de crédito o Ewallet ingresando el siguiente código en el Editor de consultas de Athena:
    SELECT "product line", "unit price", "quantity", "total", "rating", "customer type", "payment"
    FROM "sales-data"."supermarket_sales_data"
    WHERE "customer type" = 'Member' AND "payment" IN ('Credit card', 'Ewallet');
    

    La siguiente captura de pantalla muestra el resultado de la consulta.

  24. Después de crear la base de datos, en la consola de Amazon QuickSight, elija Nuevo analisis.
  25. Elige Nuevo conjunto de datos.
  26. Elija Athena como su fuente de datos.
  27. Nombre de fuente de datos, crea un nombre; por ejemplo, datos de ventas.
  28. Elige Crear fuente de datos.
  29. En Elige tu mesa sección, elija su base de datos en Athena.
  30. Seleccione las tablas que desea visualizar.
  31. Para editar cualquier objeto en su conjunto de datos, elija Editar / Vista previa de datos.
  32. Elige Seleccione.

    La siguiente captura de pantalla muestra el aspecto de los datos si cambia el tipo de datos para Date campo de String to Date. Esto abre una sección de vista previa de datos.
  33. En Fecha columna, elija el tipo de datos Cordón. Aparece una ventana con las opciones de tipo de datos disponibles.
  34. Elige Fecha.
  35. Elige Guardar.

Visualizando los datos

Ahora estás listo para crear algunas visualizaciones. Esta publicación utiliza conjuntos de datos sobre ventas de supermercados, datos de vuelos y ventas de viviendas.

Ventas de supermercado

Esta publicación usa el Ventas de supermercado conjunto de datos del sitio web de kaggle. Este conjunto de datos de series temporales es perfecto para la detección de tendencias y anomalías para los minoristas que desean encontrar rápidamente anomalías en ventas históricas y clasificar por sucursal, ciudad, fecha y hora y tipo de cliente.

Para analizar las ventas totales durante 2019 y los principales contribuyentes de ventas de productos, complete los siguientes pasos:

  1. En la consola de Amazon QuickSight, elija supermercado_ventas_análisis de datos, que creaste anteriormente.
  2. Elige Añada.
  3. Elige Añadir información.
  4. Desde el Cálculo menú desplegable, elija Detección de anomalías.
  5. Elige Seleccione.
  6. En Pozos de campo sección, para Horario, escoger datos.
  7. Valores, escoger Suma total).
  8. Categorías, escoger línea de producto.

    Se abre una nueva página de configuración.
  9. Elige Guardar.
  10. Elige Corre ahora.

    Amazon QuickSight filtra las dimensiones seleccionadas y completa una anomalía en la venta total. En el panel izquierdo, el análisis de contribución de Amazon QuickSight le muestra los principales clientes que contribuyeron a un aumento en el ciclo de ventas. Vea la siguiente captura de pantalla.

Retrasos de vuelo

La detección de anomalías también es útil para otras empresas; por ejemplo, aerolíneas que operan desde múltiples ubicaciones en todo el país. Esta publicación usa el Retraso de las aerolíneas conjunto de datos del sitio web data.world. Este conjunto de datos públicos utiliza datos del Departamento de Transporte de los EE. UU. Y realiza un seguimiento del desempeño a tiempo de los vuelos nacionales. Las aerolíneas pueden detectar anomalías que contribuyen a retrasos en la salida. Puede seguir los mismos pasos de la sección anterior para crear la visualización de anomalías. Vea la siguiente captura de pantalla.

Usando la función de autonación

Aunque los gráficos y cuadros pueden proporcionar información sobre los datos la mayor parte del tiempo, aún necesita comprender lo que puede aprender de los datos para poder explicar lo que los gráficos significan para sus socios y compañeros.

La función automática de Amazon QuickSight proporciona explicaciones directas que puede utilizar para prepararse para las discusiones ejecutivas. Dependiendo de sus datos y los gráficos en su tablero de instrumentos, Amazon QuickSight proporciona muchas ideas y narraciones de lenguaje natural automáticamente.

Agregar ideas sugeridas

Amazon QuickSight proporciona información sugerida que puede agregar a sus visualizaciones. Esta publicación muestra cómo agregar más información a las ventas de supermercados y a los conjuntos de datos de retraso de vuelos.

También puede agregar información personalizada a partir de un conjunto de cálculos preconstruidos. Para más información, ver Agregar información personalizada a su análisis.

Ventas de supermercado

Es posible que desee conocer los tres principales tipos de pago que los clientes usaron durante 2019 en las tiendas minoristas. Puede usar el conjunto de datos de ventas de supermercados para desglosar los datos por línea de producto y tipo de pago. Complete los siguientes pasos:

  1. En tu supermercado_ventas_datos análisis, bajo Tipos visuales, elegir la icono de tabla.
  2. Pozos de campo, escoger línea de producto y pago.
  3. under Insights, agregue cualquier información adicional sugerida a su visualización eligiendo el +

    La siguiente captura de pantalla muestra detalles adicionales cuando elige sus conocimientos preferidos.

Retrasos en el traslado de la aerolínea

Puede usar el conjunto de datos de la aerolínea de antes para analizar los principales retrasos en la mudanza de la aerolínea en enero de 2018, en comparación con los retrasos anteriores. Siga los mismos pasos que antes con el conjunto de datos de retrasos de vuelo. Vea la siguiente captura de pantalla.

Pronósticos basados ​​en ML

Puede recopilar puntos de datos de transacciones de clientes para pronosticar ventas futuras. Los equipos de análisis a menudo tienen que construir algoritmos complejos y soluciones basadas en ML para construir y presentar esas proyecciones. Amazon QuickSight utiliza ML para simplificar este problema con su pronóstico integrado basado en ML y su análisis de análisis hipotético. Puede obtener proyecciones visuales de sus datos sin ninguna experiencia en ML o análisis de datos.

Ventas de supermercado

Para demostrar los pronósticos basados ​​en ML, esta publicación utiliza el conjunto de datos de ventas de supermercados para pronosticar las ventas de productos en tendencias semanales y trimestrales. El conjunto de datos de ventas tiene granos de datos de múltiples puntos de datos. Para obtener más información sobre los puntos de datos apropiados, vea Requisitos del conjunto de datos para usar ML Insights con Amazon QuickSight.

Para realizar pronósticos basados ​​en ML, complete los siguientes pasos:

  1. En tu supermercado_ventas_datos análisis, bajo Tipos visuales, elegir la Gráfico de linea
  2. Pozos de campo, Para eje X, escoger datos.
  3. Valor, escoger Suma total).
  4. En lo visual, en el menú desplegable, elija Agregar pronóstico.

    Esto crea un pronóstico de gráfico de líneas. Vea la siguiente captura de pantalla.

Venta de casas

Otro caso de uso comercial popular para el pronóstico de ML es pronosticar el precio de venta de la casa utilizando datos históricos. Esta publicación usa el Venta de casas en King County, EE.UU. conjunto de datos del sitio web de kaggle, que consiste en datos de vivienda del condado de King, Washington.

Para crear un pronóstico para el precio promedio de la vivienda ordenado por fecha, siga los pasos de la sección anterior. La siguiente captura de pantalla muestra un pronóstico de gráfico de líneas.

Conclusión

Esta publicación demostró cómo crear información de gran alcance con Amazon QuickSight ML Insights, que puede ayudarlo a encontrar anomalías en sus datos, crear proyecciones y más. Para obtener más información sobre cómo personalizar ML Insights, vea Amazon QuickSight anuncia disponibilidad general de ML Insights.


Acerca de los autores

Pránabesh mandal es arquitecto de soluciones en AWS. Tiene más de una década de experiencia en TI trabajando con clientes empresariales. Le apasiona la tecnología en la nube y se enfoca en Analytics. En su tiempo libre, le gusta caminar y explorar la hermosa naturaleza y la vida salvaje de la mayoría de los parques nacionales divinos de los Estados Unidos junto a su esposa.

Karthik Odapally es Arquitecto Senior de Soluciones en AWS. Promueve una cultura basada en datos dentro de su equipo y le apasiona compartir su trabajo junto con sus clientes en las conferencias AWS Re: Invent. En su tiempo libre, hornea galletas y pastelitos para familiares y amigos aquí en el PNW. Le encantan los autos de carreras antiguos.

Fuente: https://aws.amazon.com/blogs/machine-learning/build-forecasts-and-find-anomalies-from-your-data-with-amazon-quicksight-ml-insights/

punto_img

Información más reciente

punto_img