MLOps desbloquea la clave de la IA

Actualmente, son muchos los modelos de aprendizaje automático que no pasan de la fase de prueba a producción, llegando a plantear un desafío para las empresas en el ámbito de Machine Learning. La organización que llevan muchas compañías es a través de silos y esto provoca, en ocasiones, complejidades en los terrenos de creación, administración e implementación de los modelos.

Se estima una oportunidad de negocio de 1.200 millones de dólares, y que un 85% de las empresas en la actualidad emplean la IA. En algunos países europeos, como es el caso de España, el 45% de las ganancias económicas de 2030 vendrán de la aplicación comercial de soluciones de IA. [1]

Capture

 

Desde este punto de partida, ha surgido la práctica de Machine Learning Model Operationalization Management, MLOps, para brindar a las empresas de una combinación adecuada entre ciencia de datos, ingeniería de datos y experiencia en DataOps, de manera que la puesta en marcha y escala del aprendizaje automático sea eficaz y generen alto valor empresarial. MLOps proporciona un proceso de desarrollo de Machine Learning E2E para diseñar, construir y administrar software reproducible impulsado por ML.

Entre las características más fundamentales de MLOps y su diferencia con la ingeniería de software tradicional, destaca que:

  • Su objetivo es la unificación del proceso de lanzamiento para el aprendizaje automático y nuevas aplicaciones de software.
  • Facilita las pruebas automatizadas como la validación de datos, pruebas de modelos ML o pruebas de integración de modelos.
  • Implica la introducción de principios agiles en los proyectos de ML.
  • Admite modelos y conjuntos de daros para la construcción de nuevos modelos dentro de los sistemas CI/CD.
  • Reduce las dificultades técnicas en los modelos.
  • MLOps es una práctica independiente del lenguaje, el marco, plataforma o infraestructura.

El comienzo del desarrollo de IA implica muchos procesos manuales, complejos y aislados entre los equipos de una compañía. Así, se pierde velocidad de producción para el desarrollo o el reentrenamiento de modelos y se dificulta lanzar nuevas iteraciones. Dentro de este ámbito, la integración y entrega continuas no se suelen tener en cuenta y los modelos son monitorizados pocas veces, por lo que no se conoce la degradación de su rendimiento o desviaciones de comportamiento.

Por tanto, aparece una limitación del valor potencial de la IA, cuanto mayor sea el número de modelos que se desarrollan e implementan mayor será este desafío. Sin en enfoque de MLOps los equipos pueden verse envueltos en fallos que quitan tiempo para el aspecto de la innovación continua.

MLOps crea un marco de orquestación y automatización de la canalización del ML, permitiendo un rápido desarrollo y experimentación con los modelos, gracias a la formación continua. A continuación, la integración continua que conlleva está respaldada por pruebas automatizadas y componentes de canalización modularizados. Asimismo, la colaboración y alineación entre entornos de desarrollo y producción simplifica las transferencias, respaldando la entrega continua. Todo esto con una monitorización continua que brinda una retroalimentación del rendimiento basado en datos en vivo. Por tanto, los modelos se pueden reentrenar y optimizar a lo largo del tiempo.

Entonces, MLOps se define como el DevOps para proyectos de aprendizaje automático. Esta es una metodología que facilita la puesta en marcha de los modelos de ML, centrada en herramientas y métodos para mejorar el rendimiento de los procesos.

Iniciación de MLOps

Las empresas aumentan día a día sus proyectos de IA en producción, así que para ellas será necesario un enfoque respaldado de MLOps. Por ello, es necesario que las compañías identifiquen y adopten las herramientas necesarias para satisfacer sus procesos, dándole valor y haciendo de sí misma una empresa más competitiva.

En el caso de las organizaciones que aún no hayan implantado procesos de IA, plantearse el empleo de MLOps debe surgir desde el inicio del proceso. La existencia de una estrategia preventiva es fundamental para que el trabajo empiece su entrega de valor. Dedicar un periodo de tiempo para planificar como optimizar MLOps facilitará la integración y entrega continuas. El primer paso es involucrar a todos los equipos relacionado con el proceso, es decir, científicos e ingenieros de datos, equipos de infraestructura y DevOps, desarrolladores de software, analistas de negocios, arquitectos y líderes de TI, para que todos ellos puedan investigar y desarrollar una estrategia integral.

Cada compañía tomará sus propias decisiones a lo largo del ciclo de vida de la IA, y la programación y organización variará según la estrategia definida por cada empresa. No obstante, existen algunos flujos de proceso que se usan como punto de inicio para identificar soluciones. En este proceso cabe destacar cinco etapas iniciales:

  1. Definir objetivos y resultados clave con indicadores de rendimiento (KPI), es decir, comprender los KPI de cada empresa ya que esto es el primer paso del proceso. Esta es una fase no técnica, pero fundamental para la colaboración entre los administradores de datos y los expertos de los sistemas, y datos relevantes para los procesos de implantación de modelos de ML.
  1. La adquisición de datos requiere que los científicos de datos colaboren con los ingenieros de datos para descubrir la información clave para el desarrollo del aprendizaje automático. Es necesaria la integración de la información en los Data Lake en la nube, aplicando reglas de calidad en los datos y que estos estén disponibles para la modelización. Por ejemplo, Informatica Enterprise Data Catalog (EDC), Cloud Mass Ingestion (CMI), Data Engineering Integration (DEI), Data Engineering Quality (DEQ), Data Engineering Streaming (DES) y Enterprise Data Preparation (EDP) garantizan que las canalizaciones de datos se procesen.
  1. El desarrollo de modelos es el centro del marco MLOps. Una vez se tienen los KPI definidos y los conjuntos de datos reparados, los científicos de datos pueden iniciar la experiencia del desarrollo de modelos de manera iterativa hasta que se cumplan las expectativas. Parte de las iteraciones pueden implicar colaboración con otros departamentos como los ingenieros de datos o administradores de estos. Las herramientas y los procesos de desarrollo de ML de integran con la ingeniería de daros para respaldar esta etapa.
  1. A continuación, llega la implementación de modelos. Con las canalizaciones de datos establecidas desde las primeras etapas, es hora de que el ingeniero de datos integre el modelo de ML desarrollado por el científico de datos y lo valide con los datos de producción. Todo ello, valida aún más los KPI.Luego, la canalización de datos se implementa en producción con los equipos de DataOps para su uso y monitoreo continuos. El aspecto de la integración de la ingeniería de datos ayuda a implementar el modelo de ML en el proceso de producción.
  1. Por último, es importante la fase de monitorización de un modelo, medir sus métricas y supervisar el comportamiento de este. De estas funciones se puede encargar el equipo de DataOps para asegurar un valor continuo y aumentar la confianza que se deposita en el ML. De tal manera, que se pueden establecer procesos a lo largo de vida del desarrollo del software. La ingeniería de daros se puede emplear para realizar un seguimiento de los perfiles y métricas comerciales.

Conclusiones

Una oportunidad para evaluar la creación de modelos y procesos de aprendizaje automático requiere de la construcción de una estrategia de MLOps, aunque todavía este en una fase temprana de desarrollo. También, existen plataformas que pueden ayudar con la administración del ciclo de vida del aprendizaje automático. Por tanto, es de vital importancia que cualquier compañía que quiera introducir IA, priorice las funciones y capacidades deseadas con su ecosistema existente y definir el proyecto de la empresa.

A pesar de que existen caminos predeterminados para implantar MLOps, existen diferentes metodologías para la operacionalización de la IA. Inicialmente, para que la compañía tenga existo debe centrarse en los aspectos de iniciales de la implantación y las superposiciones que existen en relación con la capa de la empresa centrada en las operaciones de aprendizaje automático. MLOps abarca el lado técnico de esta situación, ayudando a alcanzar un éxito y un aporte de valor, independientemente del tamaño de la compañía.