AutoML: explicación del aprendizaje automático automatizado
La automatización se ha convertido en una palabra de moda común en la conversación en curso sobre inteligencia artificial, ya que el software muestra potencial para hacerse cargo del trabajo de contadores, trabajadores de fábricas, escritores e incluso terapeutas. Ahora, la IA incluso está comenzando a automatizarse en un proceso conocido como aprendizaje automático automatizado.
El aprendizaje automático automatizado, o autoML para abreviar, esencialmente tiene algoritmos que se hacen cargo del proceso de construcción de un modelo de aprendizaje automático. Maneja las tareas más mundanas y repetitivas del aprendizaje automático, con la promesa de acelerar el proceso de desarrollo de IA y hacer que la tecnología sea más accesible.
En los últimos años, ha habido un gran interés en el potencial de autoML para simplificar el complejo mundo del aprendizaje automático. DataRobot a menudo se acredita como una de las primeras empresas en traerlo a la conciencia pública en 2013. Desde entonces, Meta ha denominado autoML como la "columna vertebral" de su IA, y Salesforce adquirió la empresa de análisis de datos BeyondCore para crear su propia biblioteca Einstein AutoML. Mientras tanto, los principales gigantes tecnológicos como Google, Microsoft y Amazon han lanzado sus propias herramientas de aprendizaje automático de código bajo que utilizan técnicas de autoML.
Esta adopción generalizada en la industria es importante si se tiene en cuenta que la experiencia necesaria para construir sistemas de inteligencia artificial de vanguardia es muy escasa, incluso en empresas como estas.
"Para mí, no veo otra forma de avanzar, excepto estos enfoques más automatizados", dijo a Built In Sarah Aerni, vicepresidenta de aprendizaje automático e ingeniería en Salesforce. "Hay demasiadas oportunidades para la IA y simplemente no hay suficientes personas para incorporarse al negocio, incorporarse a la tecnología, implementarla en producción, monitorearla y continuar iterando sobre ella. Para mí, autoML es donde eso entra como una solución para escalada."
Aunque el concepto de aprendizaje automático automatizado ha existido durante casi una década, sigue siendo un trabajo en progreso. Si la IA creada por IA alcanza su máximo potencial, podría aplicarse más allá de las fronteras de las empresas tecnológicas, cambiando el juego en espacios como la atención médica, las finanzas y la educación.
"Prácticamente cualquiera que use el aprendizaje automático también usará el aprendizaje automático automatizado", dijo a Built In Lars Kotthoff, profesor asistente e investigador del departamento de ciencias de la computación de la Universidad de Wyoming. "Eventualmente, esto realmente se implementará en todos los lugares donde se utilice el aprendizaje automático y la IA".
Sumérjase más en la automatización La automatización tendrá efectos de largo alcance en la economía. Esto es lo que puede esperar
A primera vista, el aprendizaje automático automatizado puede parecer un poco redundante. Después de todo, el aprendizaje automático ya se trata de automatizar el proceso de identificación de patrones en los datos para hacer predicciones. El proceso, que se basa en algoritmos y modelos estadísticos, no requiere una programación consistente o explícita. Una vez que se construye un modelo de aprendizaje automático, se puede optimizar aún más a través de prueba y error y retroalimentación, lo que significa que la máquina puede aprender por experiencia y una mayor exposición a los datos, al igual que los humanos.
En la práctica, gran parte del trabajo requerido para hacer un modelo de aprendizaje automático es bastante laborioso y requiere que los científicos de datos tomen muchas decisiones diferentes. Tienen que decidir cuántas capas incluir en las redes neuronales, qué pesos dar a las entradas en cada nodo, qué algoritmos usar y más. Es un trabajo grande y requiere mucha habilidad especializada e intuición para hacerlo correctamente.
Cuanto más complejo es el modelo, más complejo es el trabajo. Y algunos expertos dicen que será necesario automatizar parte de ese trabajo a medida que los sistemas de IA se vuelvan más complejos. Por lo tanto, autoML tiene como objetivo eliminar las conjeturas para los humanos al hacerse cargo de las decisiones que los científicos e investigadores de datos tienen que tomar actualmente al diseñar sus modelos de aprendizaje automático.
Eventualmente, el objetivo es llegar al punto en que una persona pueda hacer una pregunta sobre sus datos, aplicarle una herramienta de autoML y recibir el resultado que está buscando sin necesidad de tener demasiadas habilidades técnicas. Y si bien hay un número creciente de empresas que buscan democratizar el aprendizaje automático a través de autoML, esta tecnología es en gran medida exclusiva para personas con experiencia en inteligencia artificial y ciencia de datos. Es una herramienta, no una plataforma específica; y es una herramienta con usos bastante limitados, según Kjell Carlsson, jefe de estrategia y evangelización de ciencia de datos en Domino Data Lab.
Carlsson asesora a los clientes sobre las formas en que pueden escalar su estrategia de ciencia de datos y utilizar la IA de manera más efectiva, y describe autoML como una especie de "refuerzo" o "acelerador" para los científicos de datos.
"Puede hacer que sea más rápido para ellos descubrir las funciones que quieren usar. Puede permitirles reducir más rápidamente qué algoritmos quieren usar. Y pueden ser útiles para identificar, desde el principio, algunos problemas con sus datos. ”, dijo a Construido. "Puede ser muy útil para la fase de prueba de concepto: averiguar: '¿Es factible?'".
Obtenga la opinión de un experto Rabia contra el aprendizaje automático: mi guerra con los motores de recomendación
El aprendizaje automático automatizado, dijo Carlsson, se trata "principalmente" del aprendizaje automático supervisado, lo que significa que brinda a los usuarios información sobre el resultado que intentan predecir mediante la creación de un modelo que identifica patrones en los datos etiquetados.
Hay muchos tipos de aprendizaje automático, pero con el aprendizaje supervisado, los datos de entrada y salida etiquetados se introducen constantemente en sistemas entrenados por humanos, lo que ofrece predicciones con mayor precisión después de que cada nuevo conjunto de datos se introduce en el sistema.
Por ejemplo, si una empresa quiere poder predecir si alguien va a comprar o no su producto, primero debe tener un conjunto de datos de clientes anteriores, organizados por quién compró y quién no. Entonces tiene que ser capaz de usar ese conjunto de datos para predecir lo que decidirá hacer un nuevo conjunto de clientes. O, si desea que una computadora pueda identificar un gato en un video, primero debe entrenarlo mostrándole otros videos con gatos para que pueda identificar con precisión uno en un video que no haya visto antes.
El aprendizaje automático automatizado automatiza la selección de diferentes variables en un conjunto de datos determinado que se debe usar en un modelo, así como los algoritmos necesarios para crear ese modelo.
En el caso de predecir si una persona comprará o no, se usaría autoML para analizar los miles de puntos de datos que la empresa tiene sobre esa persona y decidir qué información se debe usar para hacer una predicción precisa. También automatiza la selección en sí y decide qué modelo tiene más sentido. Este podría ser un modelo de regresión logística, un modelo de bosque aleatorio, algún tipo de modelo de conjunto, etc., lo que sea más aplicable al caso de uso comercial.
Debido a que los algoritmos de autoML funcionan a un nivel de abstracción por encima de los modelos de aprendizaje automático subyacentes y se basan únicamente en los resultados de esos modelos como guías, también se pueden aplicar a modelos previamente entrenados para obtener nuevos conocimientos sin tener que repetir la investigación existente o el cálculo de residuos. fuerza.
El tiempo exacto que tarda AutoML depende completamente de la cantidad de datos que se introducen en el modelo, así como de la cantidad de tipos diferentes de modelos que se aplican. Para conjuntos de datos estructurados estándar (como datos de clientes en un CRM, por ejemplo), Carlsson dijo que puede ser "súper rápido" ejecutar un modelo de autoML, tan solo unos segundos. En conjuntos de datos más grandes, donde el usuario quiere probar muchas permutaciones de modelos diferentes de diferentes algoritmos para usar, podría llevar días o incluso semanas.
Obtenga más información sobre el aprendizaje automático con el aprendizaje automático integrado en el laboratorio de aprendizaje integrado
Entonces, ¿qué herramientas de autoML están disponibles? Estas son solo algunas opciones populares que se utilizan entre los profesionales de negocios para automatizar los procesos de aprendizaje automático.
El conjunto de soluciones de inteligencia artificial de Aible funciona para automatizar las tareas de ciencia e ingeniería de datos en múltiples industrias. Sus productos pueden detectar relaciones de datos clave, evaluar la preparación de los datos para la entrada del modelo y aumentar el análisis y las recomendaciones de datos. Aible se conecta directamente a la nube para la seguridad de los datos y se puede integrar con otras herramientas como Salesforce y Tableau.
AutoKeras es una biblioteca de código abierto y una herramienta de autoML basada en Keras, una API de aprendizaje automático de Python. La herramienta puede automatizar tareas de clasificación y regresión en modelos de aprendizaje profundo para imágenes, texto y datos estructurados. AutoKeras aplica en gran medida la búsqueda de arquitectura neuronal para optimizar la escritura de código, la selección de algoritmos de aprendizaje automático y el diseño de canalizaciones.
Auto-PyTorch, basado en la biblioteca de aprendizaje automático PyTorch en Python, permite tareas de aprendizaje profundo totalmente automatizadas (autoDL). Automatiza la selección de algoritmos y el ajuste de hiperparámetros para arquitecturas de redes neuronales profundas, y puede admitir conjuntos de datos tabulares y de series temporales. Auto-PyTorch aplica optimización bayesiana, metaaprendizaje y construcción de conjuntos para la automatización.
Auto-Sklearn es una herramienta de autoML de código abierto basada en la biblioteca de aprendizaje automático scikit-learn en Python. La herramienta automatiza la creación supervisada de canalizaciones de aprendizaje automático y se puede usar como un reemplazo directo para los clasificadores de scikit-learn en Python. Al igual que Auto-PyTorch, Auto-Sklearn utiliza metaaprendizaje, aprendizaje conjunto y optimización bayesiana para buscar automáticamente algoritmos de aprendizaje cuando se le proporciona un nuevo conjunto de datos.
Google Cloud AutoML es un conjunto de herramientas de autoML desarrollado por Google que se puede usar para crear modelos de aprendizaje automático personalizados. Liderando la suite está Vertex AI, una plataforma donde se pueden construir modelos para objetivos como clasificación, regresión y pronóstico en imágenes, video, texto y datos tabulares. Vertex AI ofrece API preentrenadas y es compatible con todos los marcos de aprendizaje automático de código abierto, incluidos PyTorch, TensorFlow y scikit-learn.
AutoML se puede usar en aplicaciones avanzadas de inteligencia artificial o en problemas simples que a menudo se encuentran en negocios convencionales que simplemente no tienen a los humanos para hacerlo todo.
Salesforce tiene miles de clientes que buscan predecir una variedad de cosas, desde la rotación de clientes hasta los clics de marketing por correo electrónico y las fallas de los equipos. Y todo esto requiere una gran cantidad de datos enriquecidos que son exclusivos de su negocio específico, que se pueden usar para crear modelos de aprendizaje automático personalizados. Salesforce se enfoca en hacer que la creación de estos modelos sea fácil y accesible para todos a través del aprendizaje automático automatizado.
"Para aprovechar esos datos", explicó Aerni, "[Salesforce] no puede verlos. Por lo tanto, debemos usar enfoques de aprendizaje automático automatizado para capacitarnos en el conjunto de datos de ese cliente, a fin de transformar esos datos". Esto se extiende a varias etapas del proceso de aprendizaje automático, desde la preparación de datos hasta el entrenamiento y la selección de modelos y algoritmos más apropiados, todo lo cual se realiza de forma completamente automatizada.
Arijit Sengupta, el fundador de BeyondCore, que se convirtió en el Einstein de Salesforce después de su adquisición, creó una empresa llamada Aible, con el objetivo de ayudar a cualquiera a construir un modelo de IA que genere valor. Su objetivo: "¿Cómo empoderamos a todos para que puedan extraer valor de sus datos usando IA?"
Aible hace esto al ofrecer un paquete de software. Una herramienta se enfoca en la ingeniería de datos aumentada, otra es el análisis aumentado, que brinda a las empresas información clave sobre sus datos en un lenguaje que pueden entender. Y una tercera oferta es la ciencia de datos aumentada y el aprendizaje automático, donde maneja la creación de modelos predictivos al mismo tiempo que tiene en cuenta todos los beneficios de las predicciones correctas y el costo de las predicciones incorrectas.
Por ejemplo, "¿Cuál es el beneficio de decirle correctamente que alguien comprará? ¿Cuál es el costo de decirle incorrectamente que alguien comprará cuando no lo hará? ¿Y cuánta capacidad tiene para perseguir estos prospectos?" él explicó. "Y luego nuestro sistema genera automáticamente una IA o un conjunto de IA que crearía el mayor valor económico, dado su negocio único".
Sangupta dijo que quiere distanciar a la empresa de lo que tradicionalmente se considera aprendizaje automático automático, principalmente porque considera que el autoML tradicional es "completamente inútil".
"El problema con el autoML tradicional es que no parte de la realidad comercial", dijo Sangupta. "Simplemente prueba varios parámetros y un montón de modelos, y regresa y te dice 'Aquí está el mejor modelo'. Y eso realmente es completamente inútil".
He aquí un ejemplo: imagine que el beneficio de una venta en su empresa es de $100 y el costo de buscar un cliente potencial es de $1. Es posible que esté de acuerdo con confiar en un modelo de aprendizaje automático que le brinde 99 predicciones incorrectas por cada persona que compra un producto por valor de $ 100. Pero, entonces digamos que su capacidad de ventas solo le permite 20 llamadas. Eso crea un nuevo conjunto de restricciones.
"El problema con AutoML es que es tan poderoso que si no piensa en lo que está tratando de hacer, y si no puede explicar el impacto de ese modelo en el negocio que está tratando de entender en lenguaje que los usuarios comerciales puedan entender", dijo Sangupta, "usted realmente puede lastimarse".
Esa es quizás la mayor deficiencia del aprendizaje automático automatizado: su falta de intuición comercial. Sin duda, AutoML producirá un modelo listo para la producción más rápidamente, pero no necesariamente le dirá al usuario por qué debe usar un modelo en particular o cuál es la justificación comercial, y mucho menos ofrecerá un problema justificable para resolver en medio de un conjunto masivo de datos.
"Ha sido una solución en busca de un problema durante mucho tiempo", dijo Carlsson de Domino Data Lab.
Otro problema que surge es que no existe un estándar establecido para el aspecto de un modelo de IA "bueno". ¿Se basa solo en la precisión? ¿Contribuye la velocidad? ¿O su capacidad de aprender? De cualquier manera, Carlsson dijo que esas métricas rara vez coinciden con el problema comercial real.
“La broma es que todos podemos crear un modelo que prediga la actividad terrorista con un 99,99 por ciento de precisión; simplemente predecimos que nunca habrá terrorismo”, dijo. "El terrorismo sucede con tan poca frecuencia que si solo predigo que el terrorismo nunca sucede, tengo este modelo súper preciso. Pero es un modelo inútil". Mientras tanto, si crearas un modelo que predijera si un jugador debería o no tomar otra carta en un juego de blackjack con un 50,1 por ciento de precisión, "eso me haría extraordinariamente rico", agregó.
En resumen: todo es relativo, y los modelos de AutoML no pueden determinar si sus propias predicciones son inútiles o no. Y no importa cuán complejo sea el aprendizaje automático automatizado, no ofrece el "por qué" de su proceso de toma de decisiones, que es algo que la mayoría de nosotros anhelamos cuando se trata de confiar.
Pero Kotthoff de la Universidad de Wyoming dijo que es "bastante desafiante" lograr eso, especialmente en el caso de autoML, "debido a la complejidad de toda esta maquinaria y las muchas decisiones que se toman automáticamente bajo el capó".
AutoML tampoco automatiza la ética. No hay una concepción incorporada de la equidad. Puede imponer diferentes restricciones en un esfuerzo por ser justo, como la misma tasa de rechazo, la misma tasa de aceptación, la misma probabilidad de éxito, y luego asegurarse de que la IA cumpla con esa definición de equidad, pero Sangupta dice que eso queda fuera del alcance de lo que autoML es capaz de hacer porque los humanos tienen que establecer esas restricciones.
"Ese es el peligro con autoML: terminas haciendo cosas comerciales incorrectas y haces cosas éticas incorrectas porque lo único que el sistema autoML entiende son los datos", dijo.
Más sobre la ética de la IA Ética de la IA: una guía para la IA ética
Dicho todo esto, hay ciertos problemas que se adaptan muy bien al aprendizaje automático automatizado. Estos son los problemas que requieren la creación de cientos de miles de modelos y luego la actualización periódica de esos cientos de miles de modelos.
Más a menudo, estos modelos mencionados se clasifican como modelos de pronóstico, dijo Carlsson. Por ejemplo, si un proveedor de atención médica quisiera predecir la demanda de diferentes unidades en su red de hospitales, necesitaría no solo crear diferentes modelos para cada hospital, sino también las diferentes unidades dentro de esos hospitales, así como diferentes marcos de tiempo (uno semana, tres meses, etc.). Al final, terminas con miles de modelos, cuya creación y reentrenamiento requiere una inmensa cantidad de trabajo para un científico de datos humano.
"Los modelos de AutoML funcionan muy, muy bien en este tipo de instancias", dijo Carlsson.
Y autoML generalmente no es propenso al mismo tipo de olvido o miopía que somos los humanos, especialmente cuando enfrentamos problemas grandes y complejos.
"El uso de estos enfoques automatizados tiende a obtener mejores resultados que los que pueden lograr los humanos, simplemente porque la máquina no comete errores. Toma toda esta información que recopilé de manera basada en principios y luego toma las decisiones basadas en eso, donde los humanos son propensos olvidar cosas", dijo Kotthoff.
Pero, por supuesto, la mayor ventaja del aprendizaje automático automatizado es que los científicos de datos ya no tienen que hacer el trabajo arduo y monótono de construir modelos ML manualmente, agregó. "Realmente es algo que, al final, permitirá a los humanos trabajar mejor y hacer más trabajo en poco tiempo porque no tienen que hacer las partes tediosas".
Al igual que todos los aspectos de la automatización, autoML no es inmune a la especulación en curso de que reemplaza a los empleados humanos, en particular a los que trabajan como científicos de datos. De hecho, la "democratización de la ciencia de datos" fue la frase de moda cuando DataRobot llamó la atención del público por primera vez sobre esta tecnología, y ha sido reiterada por todos, desde Salesforce hasta Google. Pero la idea de que una empresa pueda usar esta tecnología sin la ayuda de ningún científico de datos no ha dado resultado, según Carlsson.
“Debido a que las personas no saben lo que hacen los científicos de datos, existe esta opinión de 'Bueno, si tenemos las herramientas adecuadas, todos podrán hacer esto y ya no necesitaremos a los científicos de datos'. Realmente nunca he visto que eso sea cierto”, dijo, y agregó que, en todo caso, ha visto a la gente moverse en la dirección opuesta. Las empresas están contratando más científicos de datos. Y capacitar a más analistas de datos para que puedan convertirse en científicos de datos.
De hecho, dice Carlsson, no solo el autoML no reemplazará a los científicos de datos, sino que los científicos de datos son realmente las únicas personas que se benefician de esta tecnología. E incluso entonces, solo es "incrementalmente beneficioso" para ellos, principalmente porque requieren mucha orientación adicional.
"El uso de estos enfoques automatizados tiende a obtener mejores resultados que los humanos, simplemente porque la máquina no comete errores".
“Cuando estás en el mundo de los científicos de datos, la creación real del modelo es solo una pequeña parte de esto”, dijo Carlsson. Los equipos de datos pueden usar autoML un poco al principio para hacer un análisis exploratorio, pero cuando se trata de hacer el "modelo real", agregó, lo van a crear ellos mismos desde cero. "Resulta que en realidad necesitas personas que entiendan los datos, sepan cómo mirar y analizar la distribución de esos datos y sepan cómo analizar los resultados de esos datos (la validación de los datos) para que puedas crear un modelo que realmente tiene algún sentido".
Y el fundador de Aible, Sangupta, dice que las personas que están preocupadas de que AutoML reemplace a los científicos de datos no entienden el punto. Él no cree que dar a todos la capacidad de construir un modelo de IA que cree valor signifique que tenemos que deshacernos de los científicos de datos. En cambio, compara lo que hace Aible con lo que hizo el navegador Netscape para la adopción generalizada de Internet en la década de 1990: hizo que este nuevo mundo extraño e increíblemente complejo fuera más accesible para la gente común.
"Toda tecnología pasa por esta fase en la que, inicialmente, tienes estos expertos y solo los expertos pueden hacerlo. Pero el verdadero potencial llega cuando todos están facultados para aprovecharlo. Eso es lo que sucederá con la IA. Tiene que suceder". dijo Sangupta. De lo contrario, la disparidad de poder entre "la IA que tiene y los que no tienen" seguirá creciendo.
De hecho, lo que la inteligencia artificial es capaz de hacer ahora es muy diferente de lo que era hace solo unos años, y ha tenido enormes implicaciones en la forma en que se administran las empresas. Los chatbots ordinarios están superando la prueba de Turing, la IA sigue el ritmo de los delitos cibernéticos cada vez más sofisticados y los equipos de ventas trabajan con más precisión e información que nunca.
“Nuestro mundo está cambiando tan rápido que, sin IA, no puedes competir”, dijo Sangupta. "Cuando se produjo la revolución de Internet, muchas empresas que no se sumaron se extinguieron. De hecho, creo que la revolución de la IA será mucho más disruptiva que la revolución de Internet".
Actúa como una solución Buscando un problema