Descripción general de MLOps

Tags: Data science, Despliegue, Aprendizaje automático (Machine learning & LLM), MLOps, Monitoreo

La creación de un modelo de aprendizaje automático es excelente, pero para proporcionar un valor comercial real, debe ser útil y mantenerse para que siga siendo útil a lo largo del tiempo. Las operaciones de aprendizaje automático (MLOps), que se describen aquí, son un espacio de rápido crecimiento que abarca todo lo necesario para implementar un modelo de aprendizaje automático en producción, y es un aspecto crucial para ofrecer este valor buscado.

comentarios

By steve swartz, Autor de inteligencia artificial, inversionista y emprendedor en serie.

Foto: iStockPhoto / NanoStockk

Por lo general, se requiere una gran experiencia en ciencia de datos para crear un conjunto de datos y construir un modelo para una aplicación en particular. Pero construir un buen modelo no suele ser suficiente. De hecho, no es suficiente. Como se ilustra a continuación, desarrollar y probar un modelo es solo el primer paso.

Ciclo de vida del modelo de aprendizaje automático.

Las operaciones de aprendizaje automático (MLOps) son todo lo demás que se requiere para que ese modelo sea útil, incluidas las capacidades para una canalización de desarrollo e implementación automatizada, monitoreo, administración del ciclo de vida y gobernanza, como se ilustra arriba. Veamos cada uno de estos.

Canalización de automatización

La creación de un sistema de aprendizaje automático de producción requiere varios pasos: primero, los datos deben sufrir una serie de transformaciones. Luego, se entrena el modelo. Por lo general, esto requiere experimentar con diferentes arquitecturas de red e hiperparámetros. A menudo, es necesario volver a los datos y probar diferentes funciones. A continuación, el modelo debe validarse con pruebas unitarias y pruebas de integración. Necesita pasar pruebas de datos y sesgo y explicabilidad del modelo. Finalmente, se implementa en una nube pública, un entorno local o un entorno híbrido. Además, algunos pasos del proceso pueden requerir un flujo de trabajo de aprobación.

Si cada uno de estos pasos se realiza manualmente, el proceso de desarrollo tiende a ser lento y frágil. Afortunadamente, existen muchas herramientas MLOps para automatizar estos pasos desde la transformación de datos hasta la implementación de un extremo a otro. Cuando es necesario reentrenamiento, es un proceso automatizado, confiable y reproducible.

Monitoreo

Los modelos de AA tienden a funcionar bien cuando se implementan por primera vez y luego funcionan peor con el tiempo. Como analista de Forrester, Dr. Kjell Carlsson dijo: “Los modelos de IA son como niños de seis años durante la cuarentena: necesitan atención constante. . . de lo contrario, algo se romperá ".

Es fundamental que las implementaciones incluyan varios tipos de monitoreo para que los equipos de ML puedan recibir alertas cuando esto comience a suceder. El rendimiento puede degradarse debido a problemas de infraestructura, como CPU o memoria inadecuadas. El rendimiento también puede degradarse cuando los datos del mundo real que constituyen las variables independientes que se ingresan al modelo comienzan a adquirir características diferentes a las de los datos de entrenamiento, un fenómeno conocido como deriva de datos.

De manera similar, el modelo puede volverse menos aplicable debido a que las condiciones del mundo real cambian, un fenómeno conocido como deriva del concepto. Por ejemplo, muchos modelos predictivos de comportamiento de clientes y proveedores fueron lanzados en picada por COVID-19.

Algunas empresas también monitorean modelos alternativos (por ejemplo, diferentes arquitecturas de red o diferentes hiperparámetros) para ver si alguno de estos modelos "retadores" comienza a funcionar mejor que el modelo de producción.

A menudo, tiene sentido poner barreras alrededor de las decisiones tomadas por el modelo. Estas medidas de seguridad son reglas simples que activan una alerta, evitan la decisión o colocan la decisión en un flujo de trabajo para la aprobación humana.

Gestión del ciclo de vida

Cuando el rendimiento del modelo comienza a degradarse debido a los datos o la deriva del modelo, se requiere reentrenamiento del modelo y posiblemente una nueva arquitectura del modelo. Sin embargo, el equipo de ciencia de datos no debería tener que empezar de cero. Al desarrollar el modelo original, y quizás en re-arquitecturas anteriores, probablemente probaron muchas arquitecturas, hiperparámetros y características. Es fundamental que todos estos experimentos (y resultados) anteriores se registren para que el equipo de ciencia de datos no tenga que volver al punto de partida. También es fundamental para la comunicación y la colaboración entre los miembros del equipo de ciencia de datos.

Gobierno

Los modelos de aprendizaje automático se utilizan para muchas aplicaciones que afectan a las personas, como la decisión de préstamo bancario, el diagnóstico médico y las decisiones de contratación / despido. El uso de modelos ML en la toma de decisiones ha sido criticado por dos razones: Primero, estos modelos están sujetos a sesgos, especialmente si los datos de entrenamiento dan como resultado modelos que discriminan por raza, color, etnia, origen nacional, religión, género, orientación sexual u otras clases protegidas. En segundo lugar, estos modelos suelen ser cajas negras que no explican su toma de decisiones.

Como resultado, las organizaciones que utilizaron la toma de decisiones basada en ML están bajo presión para garantizar que sus modelos no discriminen y sean capaces de explicar sus decisiones. Muchos proveedores de MLOps están incorporando herramientas basadas en la investigación académica (por ejemplo, FORMA y Graduado-CAM) que ayudan a explicar las decisiones del modelo y utilizan una variedad de técnicas para garantizar que los datos y los modelos no estén sesgados. Además, están incorporando pruebas de sesgo y explicabilidad en sus protocolos de monitoreo porque los modelos pueden volverse sesgados o perder capacidad explicativa con el tiempo.

Las organizaciones también necesitan generar confianza y están comenzando a garantizar que el desempeño continuo, la ausencia de sesgos y la explicabilidad sean auditables. Esto requiere catálogos de modelos que no solo documenten todos los datos, parámetros y decisiones de arquitectura, sino que también registren cada decisión y proporcionen trazabilidad para que se pueda determinar qué datos, modelo y parámetros se utilizaron para cada decisión, cuándo se volvió a capacitar o cuándo se volvió a entrenar el modelo. modificado de otra manera, y quién hizo cada cambio. También es importante que los auditores puedan repetir transacciones históricas y probar los límites de la toma de decisiones del modelo con escenarios hipotéticos.

La seguridad y la privacidad de los datos también son preocupaciones clave para las organizaciones que utilizan ML. Se debe tener cuidado para garantizar que la información personal esté protegida y que las capacidades de acceso a datos basadas en roles sean esenciales, especialmente para las industrias reguladas.

Los gobiernos de todo el mundo también se están moviendo rápidamente para regular la toma de decisiones basada en el LA que afecta a las personas. La Unión Europea ha liderado el camino con sus regulaciones GDPR y CRD IV. En los EE. UU., Varias agencias reguladoras, incluido el Banco de la Reserva Federal de EE. UU. Y la FDA, han creado regulaciones en torno a la toma de decisiones basada en ML para decisiones financieras y médicas. Una ley más integral, la Ley de Transparencia y Responsabilidad de Datos de 2020, recientemente propuesta, está programada para ser considerada por el Congreso en 2021. Es probable que las regulaciones evolucionen hasta el punto en que el CEO necesite aprobar la explicabilidad y la falta de sesgo en sus modelos de ML. .

El paisaje de MLOps

A medida que continuamos en 2021, el mercado de MLOps está explotando. Según la firma de analistas Cognilytica, se espera que sea un $ 4 millones de mercado por 2025.

Hay grandes y pequeños jugadores en el espacio MLOps. Los principales proveedores de plataformas ML como Amazon, Google, Microsoft, IBM, Cloudera, Domino, DataRobot y H2O están incorporando capacidades MLOps en sus plataformas. Según Crunchbase, hay 35 empresas privadas en el espacio MLOps que han recaudado entre $ 1.8M y $ 1B en financiamiento y que tienen entre 3 y 2800 empleados en LinkedIn:

	Financiamiento (millones de dólares)	Número de empleados	Descripción
Cloudera	1000	2803	Cloudera ofrece una nube de datos empresarial para cualquier dato, en cualquier lugar, desde el borde hasta la inteligencia artificial.
Databricks	897	1757	Databricks es una plataforma de software que ayuda a sus clientes a unificar sus análisis en negocios, ciencia de datos e ingeniería de datos.
robot de datos	750	1105	DataRobot ofrece tecnología de inteligencia artificial y servicios de habilitación de ROI a empresas globales.
Datos	246	556	Dataiku opera como una plataforma empresarial de inteligencia artificial y aprendizaje automático.
Alteryx	163	1623	Alteryx acelera la transformación digital al unificar análisis, ciencia de datos y procesos automatizados.
H2OH	151	257	H2O.ai es el líder de código abierto en inteligencia artificial y aprendizaje automático automático con la misión de democratizar la inteligencia artificial para todos.
Dominó	124	232	Domino es la plataforma de ciencia de datos empresarial líder en el mundo, que impulsa la ciencia de datos en más del 20% de Fortune 100.
iguacio	72	83	La plataforma de ciencia de datos de Iguazio le permite desarrollar, implementar y administrar aplicaciones de inteligencia artificial a escala y en tiempo real
Explorium.ai	50	96	Explorium ofrece una plataforma de ciencia de datos impulsada por el descubrimiento de datos aumentado y la ingeniería de características.
Algoritmia	38	63	Algoritmia es una solución de implementación y gestión de modelos de aprendizaje automático que automatiza los MLOps para una organización.
Espacio papel	23	37	Paperspace impulsa las aplicaciones de próxima generación creadas en GPU.
Paquidermo	21	32	Pachyderm es una plataforma de ciencia de datos de nivel empresarial que hace realidad AI / ML explicable, repetible y escalable.
Pesos y sesgos	20	58	Herramientas para seguimiento de experimentos, rendimiento mejorado del modelo y colaboración de resultados
OctoML	19	37	OctoML está cambiando la forma en que los desarrolladores optimizan e implementan modelos de aprendizaje automático para sus necesidades de inteligencia artificial.
arturo IA	18	28	Arthur AI es una plataforma que monitorea la productividad de los modelos de aprendizaje automático.
Truera	17	26	Truera proporciona una plataforma Model Intelligence para que las empresas analicen el aprendizaje automático.
Snorkel IA	15	39	Snorkel AI se centra en hacer que la inteligencia artificial sea práctica a través de Snorkel Flow: la plataforma de datos para la inteligencia artificial empresarial
Seldon.io	14	48	Plataforma de implementación de aprendizaje automático
Laboratorios Fiddler	13	46	Fiddler permite a los usuarios crear soluciones de inteligencia artificial transparentes, explicables y comprensibles.
correr.ai	13	26	Ejecutar: AI desarrolla una tecnología de entrenamiento distribuida automatizada que virtualiza y acelera el aprendizaje profundo.
ClearML (Alegro)	11	29	ML / DL Experiment Manager y ML-Ops Open-Source Solution Solución empresarial de gestión del ciclo de vida del producto de principio a fin
Verta	10	15	Verta crea una infraestructura de software para ayudar a los equipos de ciencia de datos empresariales y aprendizaje automático (ML) a desarrollar e implementar modelos de ML.
cnvrg.io	8	38	cnvrg.io es una plataforma de ciencia de datos de pila completa que ayuda a los equipos a administrar modelos y crear canales de aprendizaje automático autoadaptables
Datatrón	8	19	Datatron proporciona una plataforma de gobierno (gestión) de modelo único para todos sus modelos de ML, IA y ciencia de datos en producción
Cometa	7	19	Comet.ml es una plataforma de aprendizaje automático diseñada para ayudar a los profesionales y equipos de IA a crear modelos confiables de aprendizaje automático.
ModeloOp	6	39	Gobierne, supervise y gestione todos los modelos en la empresa
PorquéLabs	4	15	WhyLabs es la empresa de observación y monitoreo de IA.
Arizar IA	4	14	Arize AI ofrece una plataforma que explica y soluciona problemas de IA de producción.
DarwinAI	4	31	La tecnología Generative Synthesis 'AI Building AI' de DarwinAI permite un aprendizaje profundo optimizado y explicable.
Mona	4	11	Mona es una plataforma de monitoreo SaaS para sistemas impulsados por datos e inteligencia artificial
Valohai	2	13	Su plataforma de aprendizaje automático administrado que permite a los científicos de datos crear, implementar y rastrear modelos de aprendizaje automático.
Modzy	0	31	La plataforma segura de ModelOps para descubrir, implementar, administrar y gobernar el aprendizaje automático a escala, obteniendo valor más rápido.
algomox	0	17	Catalice su transformación de IA
monitor	0	8	Monitaur es una empresa de software que proporciona auditabilidad, transparencia y gobernanza para empresas que utilizan software de aprendizaje automático.
Hidrosfera.io	0	3	Hydrosphere.io es una plataforma para la automatización de operaciones de IA / ML

Muchas de estas empresas se centran en un solo segmento de MLOps, como la canalización de automatización, la supervisión, la gestión del ciclo de vida o la gobernanza. Algunos sostienen que el uso de múltiples productos MLOps, los mejores de su clase, es mejor para proyectos de ciencia de datos que las plataformas monolíticas. Y algunas empresas están creando productos MLOps para verticales específicas. Por ejemplo, monitor se posiciona como la mejor solución de gobernanza que puede funcionar con cualquier plataforma. Monitaur también está desarrollando capacidades de gobernanza de MLOps específicas de la industria para industrias reguladas, comenzando con los seguros. (Divulgación completa: soy inversor en Monitaur).

También hay una serie de proyectos MLOps de código abierto, que incluyen:

MLFujo gestiona el ciclo de vida del AA, incluida la experimentación, la reproducibilidad y la implementación, e incluye un registro de modelo
DVC gestiona el control de versiones de los proyectos de ML para que se puedan compartir y reproducir
Poliaxón tiene capacidades para la experimentación, la automatización del ciclo de vida, la colaboración y la implementación, e incluye un registro de modelo
Metaflujo es un antiguo proyecto de Netflix para gestionar el proceso de automatización y la implementación
Kubeflow tiene capacidades para la automatización y la implementación del flujo de trabajo en contenedores de Kubernetes

2021 promete ser un año interesante para MLOps. Es probable que veamos un crecimiento rápido, una competencia tremenda y, muy probablemente, algo de consolidación.

Bio: steve swartz (@sshwartz) comenzó su carrera en IA como un postdoctorado en la Universidad de Yale hace muchos años, es un exitoso empresario e inversor en serie, y es el autor de “Robots malvados, ordenadores asesinos y otros mitos: la verdad sobre la IA y el futuro de la humanidad”.

Relacionado:

= ← Publicación anterior

Publicación siguiente → =>

Historias principales de los últimos 30 días

Más popular
¿Sigue utilizando Pandas para procesar Big Data en 2021? Aquí hay dos mejores opciones. Cómo superar el miedo a las matemáticas y aprender matemáticas para la ciencia de datos Principales canales de YouTube para ciencia de datos Más hojas de trucos sobre ciencia de datos Cómo tener éxito en convertirse en un científico de datos independiente

Lo más compartido
Cómo superar el miedo a las matemáticas y aprender matemáticas para la ciencia de datos Principales canales de YouTube para ciencia de datos ¿Sigue utilizando Pandas para procesar Big Data en 2021? Aquí hay dos mejores opciones. Cómo tener éxito en convertirse en un científico de datos independiente 3 leyes matemáticas que los científicos de datos deben conocer

Coinsmart. Mejor Bitcoin-Börse en Europa
Fuente: https://www.kdnuggets.com/2021/03/overview-mlops.html

Inteligencia de datos generativa

Descripción general de MLOps

Descripción general de MLOps

Canalización de automatización

Monitoreo

Gestión del ciclo de vida

Gobierno

El paisaje de MLOps

Historias principales de los últimos 30 días

Empoderar a los futuros innovadores de África: A2SV se asocia con Google por tercer año consecutivo para fomentar el talento en toda la tecnología africana

El crecimiento continuo de flydubai y el proyecto de modernización de la flota mejoran la experiencia de los pasajeros

Información más reciente

Emirates iniciará la ruta Dubái – Edimburgo y anuncia los primeros 9 destinos del A350

Perfiles de jugadores de tragamonedas: comprensión de los diferentes tipos de jugadores de tragamonedas en línea

Más de 30 consejos y trucos de Python

30 consejos y trucos rápidos de Pandas para principiantes

Breeze Airways lanzará cinco nuevas rutas desde el Aeropuerto Internacional Bradley

Imágenes locas muestran a un helicóptero ruso destruyendo un barco ucraniano con drones que transportaba un misil R-73