Logotipo de Zephyrnet

SambaSafety automatiza la carga de trabajo personalizada de R y mejora la seguridad de los conductores con Amazon SageMaker y AWS Step Functions | Servicios web de Amazon

Fecha:

At SambaSeguridad, su misión es promover comunidades más seguras al reducir el riesgo a través de la información de los datos. Desde 1998, SambaSafety ha sido el proveedor líder en América del Norte de software de gestión de riesgos de movilidad basado en la nube para organizaciones con conductores comerciales y no comerciales. SambaSafety brinda servicios a más de 15,000 XNUMX empleadores y compañías de seguros a nivel mundial con monitoreo de riesgo y cumplimiento del conductor, capacitación en línea y análisis de riesgo profundo, así como soluciones de fijación de precios de riesgo. A través de la recopilación, correlación y análisis de registros de conductores, datos telemáticos, corporativos y de otros sensores, SambaSafety no solo ayuda a los empleadores a hacer cumplir mejor las políticas de seguridad y a reducir las reclamaciones, sino que también ayuda a las aseguradoras a tomar decisiones de suscripción informadas y a los evaluadores de antecedentes a realizar evaluaciones previas a la contratación precisas y eficientes. cheques

No todos los conductores presentan el mismo perfil de riesgo. Cuanto más tiempo pase detrás del volante, mayor será su perfil de riesgo. El equipo de científicos de datos de SambaSafety ha desarrollado soluciones de modelado complejas y adecuadas diseñadas para cuantificar con precisión este perfil de riesgo. Sin embargo, buscaron apoyo para implementar esta solución para la inferencia por lotes y en tiempo real de manera consistente y confiable.

En esta publicación, analizamos cómo SambaSafety utilizó las herramientas de aprendizaje automático (ML) e integración continua y entrega continua (CI/CD) de AWS para implementar su aplicación de ciencia de datos existente para la inferencia por lotes. SambaSafety trabajó con el socio consultor avanzado de AWS mente de fuego para ofrecer una solución que utiliza Código de AWS, Funciones de paso de AWSy Amazon SageMaker para esta carga de trabajo. Con los productos de CI/CD y AI/ML de AWS, el equipo de ciencia de datos de SambaSafety no tuvo que cambiar su flujo de trabajo de desarrollo existente para aprovechar la inferencia y el entrenamiento continuo de modelos.

Caso de uso del cliente

El equipo de ciencia de datos de SambaSafety ha estado utilizando durante mucho tiempo el poder de los datos para informar su negocio. Contaron con varios ingenieros y científicos calificados que construyeron modelos perspicaces que mejoraron la calidad del análisis de riesgos en su plataforma. Los desafíos que enfrentó este equipo no estaban relacionados con la ciencia de datos. El equipo de ciencia de datos de SambaSafety necesitaba ayuda para conectar su flujo de trabajo de ciencia de datos existente a una solución de entrega continua.

El equipo de ciencia de datos de SambaSafety mantuvo varios artefactos similares a secuencias de comandos como parte de su flujo de trabajo de desarrollo. Estos scripts realizaron varias tareas, incluido el preprocesamiento de datos, la ingeniería de características, la creación de modelos, el ajuste de modelos y la comparación y validación de modelos. Todos estos scripts se ejecutaban manualmente cuando llegaban nuevos datos a su entorno para el entrenamiento. Además, estos scripts no realizaron ningún control de versiones ni hospedaje de modelos para la inferencia. El equipo de ciencia de datos de SambaSafety había desarrollado soluciones alternativas manuales para promover nuevos modelos para la producción, pero este proceso requería mucho tiempo y trabajo.

Para liberar al equipo de ciencia de datos altamente calificado de SambaSafety para innovar en nuevas cargas de trabajo de ML, SambaSafety necesitaba automatizar las tareas manuales asociadas con el mantenimiento de los modelos existentes. Además, la solución necesitaba replicar el flujo de trabajo manual utilizado por el equipo de ciencia de datos de SambaSafety y tomar decisiones sobre cómo proceder en función de los resultados de estos scripts. Finalmente, la solución tenía que integrarse con su base de código existente. El equipo de ciencia de datos de SambaSafety utilizó una solución de repositorio de código externa a AWS; la canalización final tenía que ser lo suficientemente inteligente como para activarse en función de las actualizaciones de su base de código, que se escribió principalmente en R.

Resumen de la solución

El siguiente diagrama ilustra la arquitectura de la solución, que fue informada por una de las muchas arquitecturas de código abierto mantenidas por el socio de entrega de SambaSafety. mente de fuego.

Diagrama de arquitectura

La solución entregada por Firemind para el equipo de ciencia de datos de SambaSafety se creó en torno a dos procesos de aprendizaje automático. La primera canalización de ML entrena un modelo utilizando los scripts de prueba, entrenamiento y preprocesamiento de datos personalizados de SambaSafety. El artefacto del modelo resultante se implementa para la inferencia por lotes y en tiempo real en los extremos del modelo administrados por SageMaker. La segunda canalización de ML facilita la solicitud de inferencia al modelo alojado. De esta forma, la canalización para el entrenamiento se desacopla de la canalización para la inferencia.

Una de las complejidades de este proyecto es replicar los pasos manuales realizados por los científicos de datos de SambaSafety. El equipo de Firemind usó Step Functions y SageMaker Processing para completar esta tarea. Step Functions le permite ejecutar tareas discretas en AWS usando AWS Lambda funciones, Servicio Amazon Elastic Kubernetes (Amazon EKS), o en este caso SageMaker. SageMaker Processing le permite definir trabajos que se ejecutan en instancias de ML administradas dentro del ecosistema de SageMaker. Cada ejecución de un trabajo de Step Function mantiene sus propios registros, historial de ejecución y detalles sobre el éxito o el fracaso del trabajo.

El equipo usó Step Functions y SageMaker, junto con Lambda, para manejar la automatización de las cargas de trabajo de capacitación, ajuste, implementación e inferencia. La única pieza que quedaba era la integración continua de los cambios de código en esta canalización de implementación. Firemind implementó un proyecto de CodeStar que mantenía una conexión con el repositorio de código existente de SambaSafety. Cuando el laborioso equipo de ciencia de datos de SambaSafety publica una actualización de una rama específica de su base de código, CodeStar recoge los cambios y activa la automatización.

Conclusión

La nueva canalización de MLOps sin servidor de SambaSafety tuvo un impacto significativo en su capacidad de entrega. La integración de la ciencia de datos y el desarrollo de software permite que sus equipos trabajen juntos sin problemas. Su solución de implementación de modelos automatizados redujo el tiempo de entrega hasta en un 70 %.

SambaSafety también dijo lo siguiente:

“Al automatizar nuestros modelos de ciencia de datos e integrarlos en su ciclo de vida de desarrollo de software, hemos podido alcanzar un nuevo nivel de eficiencia y precisión en nuestros servicios. Esto nos ha permitido mantenernos por delante de la competencia y ofrecer soluciones innovadoras a los clientes. Nuestros clientes se beneficiarán enormemente de esto con tiempos de respuesta más rápidos y precisión mejorada de nuestras soluciones”.

SambaSafety se conectó con los equipos de cuentas de AWS con su problema. Los equipos de arquitectura de soluciones y cuentas de AWS trabajaron para identificar esta solución a partir de nuestra sólida red de socios. Conéctese con su equipo de cuenta de AWS para identificar oportunidades transformadoras similares para su empresa.


Acerca de los autores

frgudDaniel Ferguson es Arquitecto de Soluciones Especializado en AI/ML (SA) en la Arquitectura de Soluciones de Capital Privado en Amazon Web Services. Dan ayuda a las empresas de cartera respaldadas por Private Equity a aprovechar las tecnologías AI/ML para lograr sus objetivos comerciales.

Khalil AdibJalil Adib es un científico de datos en Firemind, que impulsa la innovación que Firemind puede brindar a sus clientes en los mundos mágicos de IA y ML. Khalil juega con la última y mejor tecnología y modelos, asegurándose de que Firemind esté siempre a la vanguardia.

jasonmathewjason mateo es ingeniero en la nube en Firemind, liderando la entrega de proyectos para clientes de extremo a extremo desde la escritura de canalizaciones con IaC, la creación de ingeniería de datos con Python y la ampliación de los límites de ML. Jason también es el colaborador clave de los proyectos de código abierto de Firemind.

punto_img

Información más reciente

punto_img