Lo que todo CEO debe saber sobre la IA generativa
En medio de la emoción En torno a la IA generativa desde el lanzamiento de ChatGPT, Bard, Claude, Midjourney y otras herramientas de creación de contenido, es comprensible que los directores ejecutivos se pregunten: ¿es esta una exageración tecnológica o una oportunidad revolucionaria? Y si es esto último, ¿cuál es el valor para mi negocio?
Este artículo es un esfuerzo de colaboración de Michael Chui, Roger Roberts, Tanya Rodchenko, Alex Singla, Alex Sukharevsky, Lareina Yee y Delphine Zurkiya, que representan los puntos de vista del McKinsey Technology Council y QuantumBlack, AI by McKinsey, ambos parte de McKinsey Digital. .
La versión pública de ChatGPT llegó a 100 millones de usuarios en solo dos meses. Democratizó la IA de una manera nunca antes vista y se convirtió, con mucho, en la aplicación de más rápido crecimiento de la historia. Su accesibilidad lista para usar hace que la IA generativa sea diferente de todas las IA anteriores. Los usuarios no necesitan un título en aprendizaje automático para interactuar o obtener valor de él; casi cualquiera que pueda hacer preguntas puede usarlo. Y, al igual que con otras tecnologías innovadoras como la computadora personal o el iPhone, una plataforma de IA generativa puede dar lugar a muchas aplicaciones para audiencias de cualquier edad o nivel educativo y en cualquier lugar con acceso a Internet.
Todo esto es posible porque los chatbots generativos de IA funcionan con modelos básicos, que son redes neuronales expansivas entrenadas en grandes cantidades de datos no estructurados y sin etiquetar en una variedad de formatos, como texto y audio. Los modelos de base se pueden utilizar para una amplia gama de tareas. Por el contrario, las generaciones anteriores de modelos de IA a menudo eran "estrechas", lo que significa que solo podían realizar una tarea, como predecir la rotación de clientes. Un modelo básico, por ejemplo, puede crear un resumen ejecutivo para un informe técnico de 20 000 palabras sobre computación cuántica, redactar una estrategia de comercialización para un negocio de poda de árboles y proporcionar cinco recetas diferentes para los diez ingredientes en el refrigerador de alguien. . La desventaja de tal versatilidad es que, por ahora, la IA generativa a veces puede proporcionar resultados menos precisos, lo que pone una atención renovada en la gestión de riesgos de la IA.
Con las medidas de protección adecuadas, la IA generativa no solo puede desbloquear nuevos casos de uso para las empresas, sino también acelerar, escalar o mejorar los existentes. Imagine una llamada de ventas de un cliente, por ejemplo. Un modelo de IA especialmente entrenado podría sugerir oportunidades de venta adicional a un vendedor, pero hasta ahora, generalmente se basaban solo en datos estáticos del cliente obtenidos antes del inicio de la llamada, como la demografía y los patrones de compra. Una herramienta generativa de inteligencia artificial podría sugerir oportunidades de venta adicional al vendedor en tiempo real según el contenido real de la conversación, a partir de datos internos del cliente, tendencias del mercado externo y datos de personas influyentes en las redes sociales. Al mismo tiempo, la IA generativa podría ofrecer un primer borrador de un argumento de venta para que el vendedor lo adapte y personalice.
El ejemplo anterior demuestra las implicaciones de la tecnología en un puesto de trabajo. Pero casi todos los trabajadores del conocimiento pueden beneficiarse de asociarse con IA generativa. De hecho, si bien la IA generativa puede eventualmente usarse para automatizar algunas tareas, gran parte de su valor podría derivar de cómo los proveedores de software integran la tecnología en las herramientas cotidianas (por ejemplo, correo electrónico o software de procesamiento de texto) utilizadas por los trabajadores del conocimiento. Estas herramientas mejoradas podrían aumentar sustancialmente la productividad.
Los directores ejecutivos quieren saber si deben actuar ahora y, de ser así, cómo comenzar. Algunos pueden ver la oportunidad de superar a la competencia al volver a imaginar cómo los humanos hacen el trabajo con aplicaciones de IA generativa a su lado. Otros pueden querer tener cuidado, experimentar con algunos casos de uso y aprender más antes de realizar grandes inversiones. Las empresas también tendrán que evaluar si tienen la experiencia técnica, la tecnología y la arquitectura de datos, el modelo operativo y los procesos de gestión de riesgos necesarios que requerirán algunas de las implementaciones más transformadoras de la IA generativa.
El objetivo de este artículo es ayudar a los directores ejecutivos y sus equipos a reflexionar sobre el caso de la creación de valor para la IA generativa y cómo comenzar su viaje. En primer lugar, ofrecemos una introducción a la IA generativa para ayudar a los ejecutivos a comprender mejor el estado de rápida evolución de la IA y las opciones técnicas disponibles. La siguiente sección analiza cómo las empresas pueden participar en la IA generativa a través de cuatro casos de ejemplo dirigidos a mejorar la eficacia organizacional. Estos casos reflejan lo que estamos viendo entre los primeros usuarios y arrojan luz sobre la variedad de opciones en los requisitos de tecnología, costo y modelo operativo. Finalmente, abordamos el rol vital del CEO en el posicionamiento de una organización para el éxito con IA generativa.
El entusiasmo en torno a la IA generativa es palpable, y los ejecutivos de C-suite, con razón, quieren avanzar con velocidad reflexiva e intencional. Esperamos que este artículo ofrezca a los líderes empresariales una introducción equilibrada al prometedor mundo de la IA generativa.
La tecnología de IA generativa avanza rápidamente (Anexo 1). El ciclo de lanzamiento, la cantidad de nuevas empresas y la rápida integración en las aplicaciones de software existentes son notables. En esta sección, analizaremos la amplitud de las aplicaciones de IA generativa y brindaremos una breve explicación de la tecnología, incluido cómo se diferencia de la IA tradicional.
La IA generativa se puede utilizar para automatizar, aumentar y acelerar el trabajo. A los efectos de este artículo, nos centramos en las formas en que la IA generativa puede mejorar el trabajo en lugar de cómo puede reemplazar el papel de los humanos.
Si bien los chatbots generadores de texto, como ChatGPT, han recibido una gran atención, la IA generativa puede habilitar capacidades en una amplia gama de contenido, incluidas imágenes, video, audio y código de computadora. Y puede realizar varias funciones en las organizaciones, incluida la clasificación, edición, resumen, respuesta a preguntas y redacción de contenido nuevo. Cada una de estas acciones tiene el potencial de crear valor al cambiar la forma en que se realiza el trabajo a nivel de actividad en las funciones comerciales y los flujos de trabajo. Los siguientes son algunos ejemplos.
A medida que la tecnología evoluciona y madura, estos tipos de IA generativa pueden integrarse cada vez más en los flujos de trabajo empresariales para automatizar tareas y realizar directamente acciones específicas (por ejemplo, enviar automáticamente notas de resumen al final de las reuniones). Ya vemos herramientas emergentes en esta área.
Interfaz de programación de aplicaciones (API)es una forma de acceder programáticamente a modelos (generalmente externos), conjuntos de datos u otras piezas de software.
Inteligencia artificial (IA)es la capacidad del software para realizar tareas que tradicionalmente requieren inteligencia humana.
Aprendizaje profundo es un subconjunto del aprendizaje automático que utiliza redes neuronales profundas, que son capas de "neuronas" conectadas cuyas conexiones tienen parámetros o pesos que se pueden entrenar. Es especialmente eficaz para aprender de datos no estructurados, como imágenes, texto y audio.
Sintonia FINA es el proceso de adaptar un modelo básico previamente entrenado para desempeñarse mejor en una tarea específica. Esto implica un período relativamente corto de entrenamiento en un conjunto de datos etiquetados, que es mucho más pequeño que el conjunto de datos en el que se entrenó inicialmente el modelo. Esta capacitación adicional permite que el modelo aprenda y se adapte a los matices, la terminología y los patrones específicos que se encuentran en el conjunto de datos más pequeño.
Modelos de cimentación (FM) son modelos de aprendizaje profundo entrenados en grandes cantidades de datos no estructurados y sin etiquetar que se pueden usar para una amplia gama de tareas listas para usar o adaptarse a tareas específicas a través de un ajuste fino. Ejemplos de estos modelos son GPT-4, PaLM, DALL·E 2 y Stable Diffusion.
IA generativa es una IA que normalmente se crea utilizando modelos básicos y tiene capacidades que la IA anterior no tenía, como la capacidad de generar contenido. Los modelos básicos también se pueden usar para fines no generativos (por ejemplo, clasificar la opinión del usuario como negativa o positiva en función de las transcripciones de llamadas) al tiempo que ofrecen una mejora significativa con respecto a los modelos anteriores. Para simplificar, cuando nos referimos a la IA generativa en este artículo, incluimos todos los casos de uso del modelo básico.
Unidades de procesamiento de gráficos (GPU) son chips de computadora que se desarrollaron originalmente para producir gráficos de computadora (como para videojuegos) y también son útiles para aplicaciones de aprendizaje profundo. Por el contrario, el aprendizaje automático tradicional y otros análisis generalmente se ejecutan enunidades centrales de procesamiento (CPU), normalmente denominado "procesador" de una computadora.
Modelos de lenguaje grande (LLM) conforman una clase de modelos básicos que pueden procesar cantidades masivas de texto no estructurado y aprender las relaciones entre palabras o partes de palabras, conocidas como tokens. Esto permite que los LLM generen texto en lenguaje natural, realizando tareas como resúmenes o extracción de conocimiento. GPT-4 (que subyace a ChatGPT) y LaMDA (el modelo detrás de Bard) son ejemplos de LLM.
Aprendizaje automático (ML) es un subconjunto de IA en el que un modelo gana capacidades después de haber sido entrenado o mostrado en muchos puntos de datos de ejemplo. Los algoritmos de aprendizaje automático detectan patrones y aprenden a hacer predicciones y recomendaciones mediante el procesamiento de datos y experiencias, en lugar de recibir instrucciones de programación explícitas. Los algoritmos también se adaptan y pueden volverse más efectivos en respuesta a nuevos datos y experiencias.
MLOps se refiere a los patrones y prácticas de ingeniería para escalar y mantener la IA y el ML. Abarca un conjunto de prácticas que abarcan el ciclo de vida completo de ML (gestión de datos, desarrollo, implementación y operaciones en vivo). Muchas de estas prácticas ahora están habilitadas u optimizadas mediante software de soporte (herramientas que ayudan a estandarizar, optimizar o automatizar tareas).
Ingeniería rápidase refiere al proceso de diseño, refinamiento y optimización de indicaciones de entrada para guiar un modelo de IA generativo hacia la producción de resultados deseados (es decir, precisos).
Datos estructuradosson datos tabulares (por ejemplo, organizados en tablas, bases de datos u hojas de cálculo) que se pueden usar para entrenar algunos modelos de aprendizaje automático de manera efectiva.
Datos no estructuradoscarecen de un formato o estructura coherente (por ejemplo, texto, imágenes y archivos de audio) y, por lo general, requieren técnicas más avanzadas para extraer información.
Como sugiere el nombre, la forma principal en que la IA generativa difiere de las formas anteriores de IA o análisis es que puede generar contenido nuevo, a menudo en formas "no estructuradas" (por ejemplo, texto escrito o imágenes) que no se representan de forma natural en tablas con filas y columnas (consulte la barra lateral "Glosario" para obtener una lista de términos asociados con la IA generativa).
La tecnología subyacente que permite que la IA generativa funcione es una clase de redes neuronales artificiales llamadas modelos básicos. Las redes neuronales artificiales están inspiradas en los miles de millones de neuronas que están conectadas en el cerebro humano. Están entrenados usando aprendizaje profundo, un término que alude a las muchas capas (profundas) dentro de las redes neuronales. El aprendizaje profundo ha impulsado muchos de los avances recientes en IA.
Sin embargo, algunas características distinguen a los modelos básicos de las generaciones anteriores de modelos de aprendizaje profundo. Para empezar, pueden entrenarse en conjuntos extremadamente grandes y variados de datos no estructurados. Por ejemplo, un tipo de modelo básico denominado modelo de lenguaje extenso se puede entrenar con una gran cantidad de texto que está disponible públicamente en Internet y cubre muchos temas diferentes. Mientras que otros modelos de aprendizaje profundo pueden operar con cantidades considerables de datos no estructurados, generalmente se entrenan en un conjunto de datos más específico. Por ejemplo, un modelo puede ser entrenado en un conjunto específico de imágenes para permitirle reconocer ciertos objetos en fotografías.
De hecho, otros modelos de aprendizaje profundo a menudo solo pueden realizar una de esas tareas. Pueden, por ejemplo, clasificar objetos en una foto o realizar otra función, como hacer una predicción. Por el contrario, un modelo básico puede realizar ambas funciones y generar contenido también. Los modelos de Foundation acumulan estas capacidades mediante el aprendizaje de patrones y relaciones a partir de los amplios datos de entrenamiento que incorporan, lo que, por ejemplo, les permite predecir la siguiente palabra en una oración. Así es como ChatGPT puede responder preguntas sobre temas variados y cómo DALL·E 2 y Stable Diffusion pueden producir imágenes basadas en una descripción.
Dada la versatilidad de un modelo básico, las empresas pueden usar el mismo para implementar múltiples casos de uso comercial, algo que rara vez se logra con los modelos anteriores de aprendizaje profundo. Un modelo básico que haya incorporado información sobre los productos de una empresa podría utilizarse potencialmente tanto para responder a las preguntas de los clientes como para ayudar a los ingenieros a desarrollar versiones actualizadas de los productos. Como resultado, las empresas pueden implementar aplicaciones y obtener sus beneficios mucho más rápido.
Sin embargo, debido a la forma en que funcionan los modelos de base actuales, no se adaptan naturalmente a todas las aplicaciones. Por ejemplo, los modelos de lenguaje extenso pueden ser propensos a la "alucinación" o responder preguntas con afirmaciones plausibles pero falsas (consulte la barra lateral "Uso responsable de la IA generativa"). Además, no siempre se proporcionan el razonamiento subyacente o las fuentes de una respuesta. Esto significa que las empresas deben tener cuidado de integrar IA generativa sin supervisión humana en aplicaciones donde los errores pueden causar daño o donde se necesita explicación. Actualmente, la IA generativa tampoco es adecuada para analizar directamente grandes cantidades de datos tabulares o resolver problemas avanzados de optimización numérica. Los investigadores están trabajando arduamente para abordar estas limitaciones.
La IA generativa plantea una variedad de riesgos. Los directores ejecutivos querrán diseñar sus equipos y procesos para mitigar esos riesgos desde el principio, no solo para cumplir con los requisitos normativos en rápida evolución, sino también para proteger su negocio y ganarse la confianza digital de los consumidores (ofrecemos recomendaciones sobre cómo hacerlo más adelante en este artículo). artículo).1Jim Boehm, Liz Grennan, Alex Singla y Kate Smaje, "Por qué la confianza digital realmente importa", McKinsey, 12 de septiembre de 2022.
Justicia:Los modelos pueden generar sesgos algorítmicos debido a datos de entrenamiento imperfectos o decisiones tomadas por los ingenieros que desarrollan los modelos.
Propiedad intelectual (PI):Los datos de entrenamiento y los resultados del modelo pueden generar riesgos significativos de propiedad intelectual, incluidos infringir materiales con derechos de autor, marcas registradas, patentados o protegidos legalmente de cualquier otro modo. Incluso cuando se utiliza la herramienta de IA generativa de un proveedor, las organizaciones deberán comprender qué datos se incluyeron en la capacitación y cómo se utilizan en los resultados de la herramienta.
Privacidad: Podrían surgir problemas de privacidad si los usuarios ingresan información que luego termina en los resultados del modelo en una forma que hace que las personas sean identificables. La IA generativa también podría usarse para crear y difundir contenido malicioso, como desinformación, falsificaciones profundas e incitación al odio.
Seguridad: La IA generativa puede ser utilizada por malos actores para acelerar la sofisticación y la velocidad de los ciberataques. También se puede manipular para proporcionar resultados maliciosos. Por ejemplo, a través de una técnica llamada inyección rápida, un tercero le da a un modelo nuevas instrucciones que engañan al modelo para que entregue una salida no deseada por el productor del modelo y el usuario final.
Explicabilidad:La IA generativa se basa en redes neuronales con miles de millones de parámetros, lo que desafía nuestra capacidad para explicar cómo se produce una respuesta determinada.
Fiabilidad:Los modelos pueden producir diferentes respuestas a las mismas indicaciones, lo que impide la capacidad del usuario para evaluar la precisión y confiabilidad de los resultados.
Impacto organizacional:La IA generativa puede afectar significativamente a la fuerza laboral, y el impacto en grupos específicos y comunidades locales podría ser desproporcionadamente negativo.
Impacto social y ambiental:El desarrollo y la formación de modelos básicos pueden tener consecuencias sociales y ambientales perjudiciales, incluido un aumento de las emisiones de carbono (por ejemplo, la formación de un modelo de lenguaje grande puede emitir unas 315 toneladas de dióxido de carbono).2Ananya Ganesh, Andrew McCallum y Emma Strubell , "Consideraciones de política y energía para el aprendizaje profundo en NLP", Actas de la 57.ª reunión anual de la Asociación de Lingüística Computacional, 5 de junio de 2019.
Si bien los modelos básicos funcionan como el "cerebro" de la IA generativa, está surgiendo una cadena de valor completa para respaldar la capacitación y el uso de esta tecnología (Anexo 2).1 Para obtener más información, consulte "Exploración de oportunidades en la cadena de valor de la IA generativa", McKinsey, 26 de abril de 2023. El hardware especializado proporciona la amplia potencia informática necesaria para entrenar los modelos. Las plataformas en la nube ofrecen la posibilidad de aprovechar este hardware. Los proveedores de centros de modelos y MLOps ofrecen las herramientas, tecnologías y prácticas que una organización necesita para adaptar un modelo base e implementarlo dentro de sus aplicaciones de usuario final. Muchas empresas están ingresando al mercado para ofrecer aplicaciones construidas sobre modelos básicos que les permitan realizar una tarea específica, como ayudar a los clientes de una empresa con problemas de servicio.
El desarrollo de los primeros modelos básicos requería altos niveles de inversión, dados los importantes recursos computacionales requeridos para entrenarlos y el esfuerzo humano requerido para refinarlos. Como resultado, fueron desarrollados principalmente por unos pocos gigantes tecnológicos, nuevas empresas respaldadas por una inversión significativa y algunos colectivos de investigación de código abierto (por ejemplo, BigScience). Sin embargo, se está trabajando tanto en modelos más pequeños que pueden ofrecer resultados efectivos para algunas tareas como en capacitación que sea más eficiente. Esto eventualmente podría abrir el mercado a más participantes. Algunas empresas emergentes ya han logrado desarrollar sus propios modelos; por ejemplo, Cohere, Anthropic y AI21 Labs construyen y entrenan sus propios modelos de lenguaje grande.
Los directores ejecutivos deberían considerar que la exploración de la IA generativa es un deber, no un tal vez. La IA generativa puede crear valor en una amplia gama de casos de uso. Los requisitos económicos y técnicos para comenzar no son prohibitivos, mientras que la desventaja de la inacción podría ser quedarse rápidamente atrás de los competidores. Cada CEO debe trabajar con el equipo ejecutivo para reflexionar sobre dónde y cómo jugar. Algunos directores ejecutivos pueden decidir que la IA generativa presenta una oportunidad transformadora para sus empresas, ofreciendo la oportunidad de reinventar todo, desde investigación y desarrollo hasta marketing y ventas y operaciones con clientes. Otros pueden optar por comenzar de a poco y escalar más tarde. Una vez que se toma la decisión, existen vías técnicas que los expertos en IA pueden seguir para ejecutar la estrategia, según el caso de uso.
Gran parte del uso (aunque no necesariamente todo el valor) de la IA generativa en una organización provendrá de los trabajadores que empleen funciones integradas en el software que ya tienen. Los sistemas de correo electrónico brindarán una opción para escribir los primeros borradores de los mensajes. Las aplicaciones de productividad crearán el primer borrador de una presentación basada en una descripción. El software financiero generará una descripción en prosa de las características notables en un informe financiero. Los sistemas de gestión de relaciones con los clientes sugerirán formas de interactuar con los clientes. Estas características podrían acelerar la productividad de todos los trabajadores del conocimiento.
Pero la IA generativa también puede ser más transformadora en ciertos casos de uso. A continuación, observamos cuatro ejemplos de cómo las empresas en diferentes industrias están utilizando la IA generativa hoy para remodelar la forma en que se realiza el trabajo dentro de su organización.2 Estos ejemplos son amalgamas de casos seleccionados del trabajo de nuestros clientes y ejemplos públicos en lugar de reflejar eventos exactos en uno. compañía particular. Los ejemplos van desde aquellos que requieren recursos mínimos hasta empresas que requieren muchos recursos. (Para una comparación rápida de estos ejemplos y más detalles técnicos, consulte el Anexo 3).
El primer ejemplo es un caso de complejidad relativamente baja con beneficios de productividad inmediatos porque utiliza una solución de IA generativa lista para usar y no requiere personalización interna.
La mayor parte del trabajo de un ingeniero de software es escribir código. Es un proceso que requiere mucha mano de obra y requiere una extensa prueba y error e investigación en documentación privada y pública. En esta empresa, la escasez de ingenieros de software capacitados ha provocado una gran acumulación de solicitudes de funciones y corrección de errores.
Para mejorar la productividad de los ingenieros, la empresa está implementando un producto de finalización de código basado en IA que se integra con el software que usan los ingenieros para codificar. Esto permite a los ingenieros escribir descripciones de código en lenguaje natural, mientras que la IA sugiere varias variantes de bloques de código que satisfarán la descripción. Los ingenieros pueden seleccionar una de las propuestas de la IA, realizar los ajustes necesarios y hacer clic en ella para insertar el código.
Nuestra investigación ha demostrado que tales herramientas pueden acelerar la generación de código de un desarrollador hasta en un 50 por ciento. También puede ayudar en la depuración, lo que puede mejorar la calidad del producto desarrollado. Pero hoy, la IA generativa no puede reemplazar a los ingenieros de software calificados. De hecho, los ingenieros con más experiencia parecen obtener los mayores beneficios de productividad de las herramientas, mientras que los desarrolladores sin experiencia ven resultados menos impresionantes y, a veces, negativos. Un riesgo conocido es que el código generado por IA puede contener vulnerabilidades u otros errores, por lo que los ingenieros de software deben participar para garantizar la calidad y la seguridad del código (consulte la sección final de este artículo para conocer las formas de mitigar los riesgos).
El costo de esta herramienta de codificación de IA generativa lista para usar es relativamente bajo, y el tiempo de comercialización es corto porque el producto está disponible y no requiere un desarrollo interno significativo. El costo varía según el proveedor de software, pero las suscripciones de tarifa fija oscilan entre $10 y $30 por usuario por mes. Al elegir una herramienta, es importante discutir los problemas de licencia y propiedad intelectual con el proveedor para garantizar que el código generado no genere infracciones.
El soporte de la nueva herramienta es un pequeño equipo multifuncional centrado en seleccionar el proveedor de software y monitorear el rendimiento, lo que debe incluir la verificación de problemas de propiedad intelectual y seguridad. La implementación solo requiere cambios en el flujo de trabajo y en las políticas. Debido a que la herramienta es puramente software como servicio (SaaS), los costos adicionales de computación y almacenamiento son mínimos o inexistentes.
Las empresas pueden decidir crear sus propias aplicaciones de IA generativa, aprovechando los modelos básicos (a través de API o modelos abiertos), en lugar de utilizar una herramienta estándar. Esto requiere un aumento en la inversión con respecto al ejemplo anterior, pero facilita un enfoque más personalizado para satisfacer el contexto y las necesidades específicas de la empresa.
En este ejemplo, un gran banco corporativo quiere usar IA generativa para mejorar la productividad de los gerentes de relaciones (RM). Los RM pasan un tiempo considerable revisando documentos grandes, como informes anuales y transcripciones de llamadas de ganancias, para mantenerse informados sobre la situación y las prioridades de un cliente. Esto permite a la RM ofrecer servicios adecuados a las necesidades particulares del cliente.
El banco decidió crear una solución que acceda a un modelo base a través de una API. La solución escanea documentos y puede proporcionar rápidamente respuestas sintetizadas a las preguntas planteadas por los RM. Se crean capas adicionales alrededor del modelo base para optimizar la experiencia del usuario, integrar la herramienta con los sistemas de la empresa y aplicar controles de riesgo y cumplimiento. En particular, los resultados del modelo deben verificarse, de la misma manera que una organización verificaría los resultados de un analista junior, porque se sabe que algunos modelos de lenguaje grandes tienen alucinaciones. Los RM también están capacitados para hacer preguntas de una manera que proporcione las respuestas más precisas de la solución (lo que se denomina ingeniería rápida), y se implementan procesos para agilizar la validación de los resultados de la herramienta y las fuentes de información.
En este caso, la IA generativa puede acelerar el proceso de análisis de un RM (de días a horas), mejorar la satisfacción laboral y, potencialmente, capturar información que el RM podría haber pasado por alto.
El costo de desarrollo proviene principalmente de la construcción de la interfaz de usuario y las integraciones, que requieren tiempo de un científico de datos, un ingeniero de aprendizaje automático o un ingeniero de datos, un diseñador y un desarrollador front-end. Los gastos continuos incluyen el mantenimiento del software y el costo de usar las API. Los costos dependen de la elección del modelo y de las tarifas del proveedor externo, el tamaño del equipo y el tiempo hasta el producto mínimo viable.
El siguiente nivel de sofisticación es el ajuste fino de un modelo básico. En este ejemplo, una empresa utiliza un modelo básico optimizado para conversaciones y lo ajusta en sus propios chats de clientes de alta calidad y preguntas y respuestas específicas del sector. La empresa opera en un sector con terminología especializada (por ejemplo, derecho, medicina, bienes raíces y finanzas). El servicio al cliente rápido es un diferenciador competitivo.
Los representantes de atención al cliente de esta empresa manejan cientos de consultas entrantes al día. Los tiempos de respuesta a veces eran demasiado altos, lo que provocaba la insatisfacción de los usuarios. La empresa decidió introducir un bot de servicio al cliente de inteligencia artificial generativa para manejar la mayoría de las solicitudes de los clientes. El objetivo era una respuesta rápida en un tono que coincidiera con la marca de la empresa y las preferencias del cliente. Parte del proceso de ajuste y prueba del modelo base incluye garantizar que las respuestas estén alineadas con el lenguaje específico del dominio, la promesa de la marca y el tono establecido para la empresa; se requiere un monitoreo continuo para verificar el desempeño del sistema en múltiples dimensiones, incluida la satisfacción del cliente.
La empresa creó una hoja de ruta del producto que consta de varias oleadas para minimizar los posibles errores del modelo. En la primera ola, el chatbot se puso a prueba internamente. Los empleados pudieron dar respuestas de "aprobación" o "aprobación" a las sugerencias del modelo, y el modelo pudo aprender de estas entradas. Como siguiente paso, el modelo "escuchó" las conversaciones de atención al cliente y ofreció sugerencias. Una vez que la tecnología se probó lo suficiente, comenzó la segunda ola y el modelo se cambió hacia casos de uso orientados al cliente con un ser humano en el circuito. Eventualmente, cuando los líderes confían completamente en la tecnología, se puede automatizar en gran medida.
En este caso, la IA generativa liberó a los representantes de servicio para que se centren en consultas de clientes complejas y de mayor valor, mejoró la eficiencia y la satisfacción laboral de los representantes y aumentó los estándares de servicio y la satisfacción del cliente. El bot tiene acceso a todos los datos internos del cliente y puede "recordar" conversaciones anteriores (incluidas las llamadas telefónicas), lo que representa un cambio radical con respecto a los chatbots de clientes actuales.
Para capturar los beneficios, este caso de uso requirió inversiones materiales en software, infraestructura en la nube y talento tecnológico, así como mayores grados de coordinación interna en riesgo y operaciones. En general, ajustar los modelos básicos cuesta de dos a tres veces más que crear una o más capas de software sobre una API. Los costos de talento y de terceros para la computación en la nube (si se ajusta un modelo autohospedado) o para la API (si se ajusta a través de una API de terceros) representan el aumento de los costos. Para implementar la solución, la empresa necesitó la ayuda de expertos en DataOps y MLOps, así como el aporte de otras funciones, como especialistas en administración de productos, diseño, legal y servicio al cliente.
Los casos de uso de IA generativa más complejos y personalizados surgen cuando no hay disponibles modelos básicos adecuados y la empresa necesita construir uno desde cero. Esta situación puede surgir en sectores especializados o al trabajar con conjuntos de datos únicos que son significativamente diferentes de los datos utilizados para entrenar modelos básicos existentes, como lo demuestra este ejemplo farmacéutico. Entrenar un modelo de base desde cero presenta importantes desafíos técnicos, de ingeniería y de recursos. El retorno adicional de la inversión por usar un modelo de mayor rendimiento debería superar los costos financieros y de capital humano.
En este ejemplo, los científicos de investigación en el descubrimiento de fármacos en una empresa farmacéutica tenían que decidir qué experimentos ejecutar a continuación, basándose en imágenes de microscopía. Tenían un conjunto de datos de millones de estas imágenes, que contenían una gran cantidad de información visual sobre las características de las células que son relevantes para el descubrimiento de fármacos pero difíciles de interpretar para un ser humano. Las imágenes se utilizaron para evaluar posibles candidatos terapéuticos.
La empresa decidió crear una herramienta que ayudaría a los científicos a comprender la relación entre la química de los fármacos y los resultados microscópicos registrados para acelerar los esfuerzos de I+D. Dado que estos modelos multimodales aún están en pañales, la empresa decidió entrenar los suyos propios. Para construir el modelo, los miembros del equipo emplearon imágenes del mundo real que se usan para entrenar modelos básicos basados en imágenes y su gran conjunto de datos de imágenes de microscopía interna.
El modelo entrenado agregó valor al predecir qué fármacos candidatos podrían conducir a resultados favorables y al mejorar la capacidad de identificar con precisión las características celulares relevantes para el descubrimiento de fármacos. Esto puede conducir a procesos de descubrimiento de fármacos más eficientes y efectivos, no solo mejorando el tiempo de obtención de valor, sino también reduciendo la cantidad de análisis inexactos, engañosos o fallidos.
En general, entrenar un modelo desde cero cuesta entre diez y veinte veces más que crear software en torno a una API modelo. Los equipos más grandes (incluidos, por ejemplo, expertos en aprendizaje automático con doctorado) y un mayor gasto en computación y almacenamiento explican las diferencias en el costo. El costo proyectado de entrenar un modelo base varía ampliamente según el nivel de rendimiento del modelo deseado y la complejidad del modelado. Esos factores influyen en el tamaño requerido del conjunto de datos, la composición del equipo y los recursos informáticos. En este caso de uso, el equipo de ingeniería y los gastos continuos de la nube representaron la mayoría de los costos.
La empresa descubrió que se necesitarían actualizaciones importantes en su infraestructura y procesos tecnológicos, incluido el acceso a muchas instancias de GPU para entrenar el modelo, herramientas para distribuir la capacitación en muchos sistemas y MLOps de mejores prácticas para limitar el costo y la duración del proyecto. Además, se requirió un trabajo sustancial de procesamiento de datos para la recopilación, la integración (garantizar que los archivos de diferentes conjuntos de datos tengan el mismo formato y resolución) y la limpieza (filtrar datos de baja calidad, eliminar duplicados y garantizar que la distribución esté en línea con el objetivo previsto). usar). Dado que el modelo básico se entrenó desde cero, se necesitaban pruebas rigurosas del modelo final para garantizar que la salida fuera precisa y segura de usar.
Los casos de uso descritos aquí ofrecen importantes conclusiones para los directores ejecutivos a medida que se embarcan en el viaje de la IA generativa:
El CEO tiene un papel crucial que desempeñar para catalizar el enfoque de una empresa en la IA generativa. En esta sección de cierre, discutimos las estrategias que los directores ejecutivos querrán tener en cuenta al comenzar su viaje. Muchos de ellos se hacen eco de las respuestas de los altos ejecutivos a las oleadas anteriores de nuevas tecnologías. Sin embargo, la IA generativa presenta sus propios desafíos, incluida la gestión de una tecnología que se mueve a una velocidad nunca antes vista en transiciones tecnológicas anteriores.
Muchas organizaciones comenzaron a explorar las posibilidades de la IA tradicional a través de experimentos en silos. La IA generativa requiere un enfoque más deliberado y coordinado dadas sus consideraciones de riesgo únicas y la capacidad de los modelos básicos para respaldar múltiples casos de uso en una organización. Por ejemplo, un modelo ajustado utilizando material patentado para reflejar la identidad de marca de la empresa podría implementarse en varios casos de uso (por ejemplo, generar campañas de marketing personalizadas y descripciones de productos) y funciones comerciales, como desarrollo de productos y marketing.
Con ese fin, recomendamos convocar a un grupo multifuncional de los líderes de la empresa (por ejemplo, que represente a la ciencia de datos, ingeniería, legal, ciberseguridad, marketing, diseño y otras funciones comerciales). Dicho grupo no solo puede ayudar a identificar y priorizar los casos de uso de mayor valor, sino que también permite una implementación coordinada y segura en toda la organización.
La IA generativa es una herramienta poderosa que puede transformar la forma en que operan las organizaciones, con un impacto particular en ciertos dominios comerciales dentro de la cadena de valor (por ejemplo, marketing para un minorista u operaciones para un fabricante). La facilidad de implementar IA generativa puede tentar a las organizaciones a aplicarla en casos de uso esporádicos en toda la empresa. Es importante tener una perspectiva sobre la familia de casos de uso por dominio que tendrá el potencial más transformador en todas las funciones comerciales. Las organizaciones están reinventando el estado objetivo habilitado por la IA generativa que funciona en sincronía con otras aplicaciones tradicionales de IA, junto con nuevas formas de trabajo que quizás antes no hubieran sido posibles.
Una pila moderna de datos y tecnología es clave para casi cualquier enfoque exitoso de la IA generativa. Los directores ejecutivos deben consultar a sus directores de tecnología para determinar si la empresa tiene las capacidades técnicas requeridas en términos de recursos informáticos, sistemas de datos, herramientas y acceso a modelos (código abierto a través de centros de modelos o comercial a través de API).
Por ejemplo, el elemento vital de la IA generativa es el acceso fluido a los datos perfeccionados para un contexto o problema comercial específico. Las empresas que aún no han encontrado formas de armonizar y brindar acceso inmediato a sus datos de manera efectiva no podrán ajustar la IA generativa para desbloquear más de sus usos potencialmente transformadores. Igualmente importante es diseñar una arquitectura de datos escalable que incluya procedimientos de seguridad y gobierno de datos. Según el caso de uso, la infraestructura informática y de herramientas existente (que puede obtenerse a través de un proveedor de la nube o configurarse internamente) también podría necesitar una actualización. Una estrategia clara de datos e infraestructura anclada en el valor comercial y la ventaja competitiva derivada de la IA generativa será fundamental.
Los directores ejecutivos querrán evitar quedarse atascados en las etapas de planificación. Se están desarrollando y lanzando rápidamente nuevos modelos y aplicaciones. GPT-4, por ejemplo, se lanzó en marzo de 2023, luego del lanzamiento de ChatGPT (GPT-3.5) en noviembre de 2022 y GPT-3 en 2020. En el mundo de los negocios, el tiempo es esencial y el ritmo acelerado La naturaleza de la tecnología de IA generativa exige que las empresas se muevan rápidamente para aprovecharla. Hay algunas formas en que los ejecutivos pueden seguir moviéndose a un ritmo constante.
Aunque la IA generativa aún se encuentra en sus inicios, es importante mostrar internamente cómo puede afectar el modelo operativo de una empresa, tal vez a través de un "enfoque faro". Por ejemplo, una forma de avanzar es crear un "experto virtual" que permita a los trabajadores de primera línea acceder a fuentes de conocimiento patentadas y ofrecer el contenido más relevante a los clientes. Esto tiene el potencial de aumentar la productividad, crear entusiasmo y permitir que una organización pruebe internamente la IA generativa antes de escalar a aplicaciones orientadas al cliente.
Al igual que con otras oleadas de innovación técnica, habrá fatiga de prueba de concepto y muchos ejemplos de empresas atrapadas en el "purgatorio piloto". Pero alentar una prueba de concepto sigue siendo la mejor manera de probar y refinar rápidamente un caso de negocios valioso antes de escalar a casos de uso adyacentes. Al centrarse en las ganancias tempranas que brindan resultados significativos, las empresas pueden generar impulso y luego escalar hacia arriba y hacia arriba, aprovechando la naturaleza multipropósito de la IA generativa. Este enfoque podría permitir a las empresas promover una adopción más amplia de IA y crear la cultura de innovación que es esencial para mantener una ventaja competitiva. Como se describió anteriormente, el equipo de liderazgo multifuncional querrá asegurarse de que tales pruebas de concepto sean deliberadas y coordinadas.
Como demuestran nuestros cuatro casos de uso detallados, los líderes empresariales deben equilibrar las oportunidades de creación de valor con los riesgos que implica la IA generativa. Según nuestra reciente Encuesta global sobre IA, la mayoría de las organizaciones no mitigan la mayoría de los riesgos asociados con la IA tradicional, aunque más de la mitad de las organizaciones ya han adoptado la tecnología.3"El estado de la IA en 2022, y media década en revisión", McKinsey, 6 de diciembre de 2022. La IA generativa trae una atención renovada a muchos de estos mismos riesgos, como el potencial de perpetuar el sesgo oculto en los datos de entrenamiento, al tiempo que presenta otros nuevos, como su propensión a alucinar.
Como resultado, el equipo de liderazgo multifuncional querrá no solo establecer principios y pautas éticos generales para el uso de IA generativa, sino también desarrollar una comprensión profunda de los riesgos presentados por cada caso de uso potencial. Será importante buscar casos de uso iniciales que se alineen con la tolerancia al riesgo general de la organización y tengan estructuras implementadas para mitigar el riesgo consecuente. Por ejemplo, una organización minorista podría priorizar un caso de uso que tenga un valor ligeramente menor pero también un menor riesgo, como la creación de borradores iniciales de contenido de marketing y otras tareas que mantienen a un ser humano informado. Al mismo tiempo, la empresa podría dejar de lado un caso de uso de mayor valor y alto riesgo, como una herramienta que redacte y envíe automáticamente correos electrónicos de marketing hiperpersonalizados. Tales prácticas de anticipación de riesgos pueden permitir que las organizaciones establezcan los controles necesarios para administrar adecuadamente la IA generativa y mantener el cumplimiento.
Los directores ejecutivos y sus equipos también querrán mantenerse al día con los últimos desarrollos en la regulación de IA generativa, incluidas las reglas relacionadas con la protección de datos del consumidor y los derechos de propiedad intelectual, para proteger a la empresa de problemas de responsabilidad. Los países pueden adoptar diferentes enfoques para la regulación, como a menudo ya lo hacen con la IA y los datos. Es posible que las organizaciones deban adaptar su enfoque de trabajo para calibrar la gestión de procesos, la cultura y la gestión del talento de una manera que garantice que pueden manejar el entorno regulatorio en rápida evolución y los riesgos de la IA generativa a escala.
Los líderes empresariales deben centrarse en construir y mantener un conjunto equilibrado de alianzas. La estrategia de adquisiciones y alianzas de una empresa debe continuar concentrándose en construir un ecosistema de socios adaptados a diferentes contextos y abordar lo que la IA generativa requiere en todos los niveles de la pila tecnológica, mientras se tiene cuidado de evitar el bloqueo de proveedores.
Asociarse con las empresas adecuadas puede ayudar a acelerar la ejecución. Las organizaciones no tienen que desarrollar todas las aplicaciones o modelos básicos por sí mismas. En su lugar, pueden asociarse con proveedores y expertos en IA generativa para moverse más rápidamente. Por ejemplo, pueden asociarse con proveedores de modelos para personalizar modelos para un sector específico, o asociarse con proveedores de infraestructura que ofrecen capacidades de soporte como computación en la nube escalable.
Las empresas pueden utilizar la experiencia de otros y moverse rápidamente para aprovechar la última tecnología de IA generativa. Pero los modelos generativos de IA son solo la punta de lanza: se requieren múltiples elementos adicionales para la creación de valor.
Para aplicar efectivamente la IA generativa para el valor comercial, las empresas deben desarrollar sus capacidades técnicas y mejorar las habilidades de su fuerza laboral actual. Esto requiere un esfuerzo concertado por parte del liderazgo para identificar las capacidades requeridas en función de los casos de uso priorizados de la empresa, que probablemente se extenderán más allá de los roles técnicos para incluir una combinación de talentos en ingeniería, datos, diseño, riesgo, producto y otras funciones comerciales.
Como se demostró en los casos de uso destacados anteriormente, las necesidades técnicas y de talento varían ampliamente según la naturaleza de una implementación determinada, desde el uso de soluciones listas para usar hasta la creación de un modelo básico desde cero. Por ejemplo, para construir un modelo generativo, una empresa puede necesitar expertos en aprendizaje automático con doctorado; por otro lado, para desarrollar herramientas de IA generativa utilizando modelos existentes y ofertas de SaaS, un ingeniero de datos y un ingeniero de software pueden ser suficientes para liderar el esfuerzo.
Además de contratar al talento adecuado, las empresas querrán capacitar y educar a su fuerza laboral existente. Las interfaces de usuario conversacionales basadas en avisos pueden hacer que las aplicaciones de IA generativas sean fáciles de usar. Pero los usuarios aún necesitan optimizar sus mensajes, comprender las limitaciones de la tecnología y saber dónde y cuándo pueden integrar la aplicación de manera aceptable en sus flujos de trabajo. El liderazgo debe proporcionar pautas claras sobre el uso de herramientas de IA generativa y ofrecer educación y capacitación continuas para mantener a los empleados informados sobre sus riesgos. Fomentar una cultura de investigación y experimentación autodirigida también puede alentar a los empleados a innovar en procesos y productos que incorporen de manera efectiva estas herramientas.
Las empresas han estado persiguiendo ambiciones de IA durante años y muchas han obtenido nuevas fuentes de ingresos, mejoras de productos y eficiencias operativas. Gran parte de los éxitos en estas áreas provienen de las tecnologías de IA que siguen siendo la mejor herramienta para un trabajo en particular, y las empresas deben continuar ampliando esos esfuerzos. Sin embargo, la IA generativa representa otro salto prometedor y un mundo de nuevas posibilidades. Si bien el andamiaje operativo y de riesgo de la tecnología aún se está construyendo, los líderes empresariales saben que deben embarcarse en el viaje de la IA generativa. Pero, ¿dónde y cómo deberían empezar? La respuesta variará de una empresa a otra, así como dentro de una organización. Algunos comenzarán a lo grande; otros pueden emprender experimentos más pequeños. El mejor enfoque dependerá de la aspiración y el apetito por el riesgo de una empresa. Cualquiera que sea la ambición, la clave es ponerse en marcha y aprender haciendo.
miguel chuies socio del McKinsey Global Institute y socio de la oficina del Área de la Bahía de McKinsey, donderoger robertses un socio,tania rodchenkoes socio asociado, ylareina yee, presidente del McKinsey Technology Council, es socio principal.Alex Singla, socio mayoritario de la oficina de Chicago, yAlex Sujarevsky, socio sénior de la oficina de Londres, son líderes mundiales de QuantumBlack, AI by McKinsey.Delfina Zurkiyaes socio mayoritario en la oficina de Boston.
Crédito: Video creado por Chris Grava/Darby Films utilizando un lenguaje de programación visual basado en nodos
En medio de la emoción Interfaz de programación de aplicaciones (API) Inteligencia artificial (IA) Aprendizaje profundo Ajuste fino Modelos básicos (FM) IA generativa Unidades de procesamiento de gráficos (GPU) Unidades de procesamiento central (CPU) Modelos de lenguaje grande (LLM) Aprendizaje automático (ML) MLOps Ingeniería rápida Datos estructurados Datos no estructurados Equidad: Propiedad intelectual (IP): Privacidad: Seguridad: Explicabilidad: Confiabilidad: Impacto organizacional: Impacto social y ambiental: Michael Chui Roger Roberts Tanya Rodchenko Lareina Yee Alex Singla Alex Sukharevsky Delphine Zurkiya