Aprendizaje automático para potenciar la investigación
La inteligencia artificial, o aprendizaje automático, puede respaldar análisis complejos y avanzar en investigaciones de calidad, pero solo cuando se usa con cuidado. John F. Wu comparte consejos sobre cómo el aprendizaje automático puede empoderar a los investigadores
También te puede interesar
Recursos populares
La inteligencia artificial (IA), o el aprendizaje automático, parece estar en todas partes en estos días. Si es investigador, probablemente haya visto aparecer estos términos cada vez más en la literatura académica de su campo. Pero, ¿cuánto de esto es realmente útil? ¿Debería también aprovechar el aprendizaje automático?
En este artículo, describiré algunos casos de cuándo el aprendizaje automático es útil para la investigación, y también cuándo no lo es, inspirándome en mi propio campo en astronomía.
El aprendizaje automático ofrece el mayor valor para los problemas de investigación "basados en datos": cuando tiene tantos datos que no puede inspeccionarlos manualmente. En estos escenarios, el aprendizaje automático puede aligerar su carga de trabajo y permitirle concentrarse en su área de investigación. Sin embargo, la adopción del aprendizaje automático no está exenta de riesgos y costos ocultos.
Cuando se aplica con cuidado, a través de la lente de un escéptico, el aprendizaje automático puede permitir programas de investigación que de otro modo serían inviables. En términos generales, el aprendizaje automático puede empoderar a los investigadores de cuatro maneras.
A veces desea saber si su conjunto de datos se puede usar para determinar otra cosa. Por ejemplo, es posible que haya oído hablar de cómo el aprendizaje automático en medicina puede ayudar a los médicos a detectar el cáncer. En mi campo de la astronomía, es bastante simple tomar imágenes de millones de galaxias, pero tradicionalmente hemos necesitado tomar y analizar observaciones especializadas para comprender los detalles de cómo evolucionan las galaxias. Al usar el aprendizaje automático, mis colaboradores y yo descubrimos que en realidad podíamos estudiar estas galaxias únicamente usando imágenes.
Es fácil crear nuevos modelos de cómo deberían comportarse las cosas, pero la verdadera prueba de cualquier modelo es si tiene algún poder predictivo. Al identificar conexiones dentro de sus datos, puede formular un modelo, y el aprendizaje automático también puede hacerlo. Los científicos han utilizado el aprendizaje automático para resumir estas conexiones en el lenguaje de las matemáticas y descubrir una nueva fórmula que explica la distribución de la materia en escalas cósmicas.
Si el aprendizaje automático se puede utilizar para encontrar las tendencias típicas, quizás no sea sorprendente que el aprendizaje automático también sea excelente para detectar cosas anómalas. Muchos campos de investigación pueden beneficiarse de un análisis exhaustivola investigación de fenómenos raros y el aprendizaje automático pueden ayudarlo a detectar la "aguja en el pajar".En astronomía, el aprendizaje automático también se ha utilizado para detectar fenómenos raros, como las ondas gravitacionales.eventos, supernovas, galaxias con lentes gravitacionales, datos procesados incorrectamente y mucho más. Un análisis de galaxias atípicas encontró muchos fenómenos interesantes(incluidas muchas "galaxias" que no eran galaxias en absoluto).
Seamos honestos: algunos aspectos de la investigación son aburridos y consumen mucho tiempo. En radioastronomía, se requieren grandes recursos computacionales y mucho tiempo para eliminar señales artificiales y datos corruptos. El aprendizaje automático puede realizar estas tareas utilizando una fracción del costo y el tiempo.
Al acelerar las partes aburridas de la investigación, el aprendizaje automático también puede habilitar nuevos tipos de análisis que de otro modo no serían posibles. Muchos problemas de investigación intentan abordar el siguiente problema: dado un resultado observado, ¿cuáles son los parámetros para un modelo que produjo tal resultado? Estos llamados problemas inversos se pueden abordar de manera eficiente utilizando el aprendizaje automático. Para obtener más detalles, lea sobre la inferencia basada en simulación.
Los conjuntos de datos son cada vez más grandes, pero hay muchas formas de combinar características en versiones condensadas. Los métodos de reducción de la dimensionalidad incluyen enfoques clásicos como el análisis de componentes principales (PCA), la incrustación de vecinos estocásticos distribuidos en t (t-SNE) y la aproximación y proyección de colectores uniformes (UMAP), o técnicas de aprendizaje automático como el uso de redes neuronales preentrenadas o similares. algoritmos para transformar los datos en versiones resumidas.
También es útil comprender qué entradas (o características) son más importantes para hacer predicciones. Diferentes algoritmos de aprendizaje automático revelan las características más importantes de diferentes maneras; por ejemplo, los bosques aleatorios pueden clasificar automáticamente las características por importancia. Para los modelos de redes neuronales, el mapeo de prominencia le permite identificar qué píxeles de una imagen son los más esenciales para hacer una predicción (por ejemplo, el mapeo de activación de clases con ponderación de gradiente o Grad-CAM). Estos algoritmos proporcionan cierto nivel de interpretabilidad de aprendizaje automático que puede beneficiar a su programa de investigación.
Recuerde que no todos los problemas pueden, o deben, abordarse utilizando el aprendizaje automático. métodos. El aprendizaje automático simplemente proporciona un conjunto diferente de herramientas que puede agregar a su conjunto de herramientas. Con suerte, al combinar estas herramientas novedosas con la experiencia en un dominio específico, podrá discernir qué herramientas son las mejores para los problemas que está tratando de resolver. El aprendizaje automático puede ser particularmente útil cuando tiene una gran cantidad de datos y si su investigación se beneficia de la búsqueda de tendencias o valores atípicos, la aceleración del aprendizaje automático, la visualización de datos o la clasificación de importancia de características. En los próximos años, las aplicaciones inteligentes del aprendizaje automático pueden transformar potencialmente la forma en que se realiza la investigación.
John F. Wu es astrónomo asistente en el Instituto de Ciencias del Telescopio Espacial y científico investigador asociado en la Universidad Johns Hopkins.
Si le pareció interesante y desea que los académicos y el personal de la universidad reciban consejos e información directamente en su bandeja de entrada cada semana, suscríbase al boletín de THE Campus.
Aplicar el aprendizaje automático sin pensar puede dar lugar a algunos análisis peligrosos. Algunos algoritmos de aprendizaje automático tienen una curva de aprendizaje pronunciada. El hecho de que se pueda hacer con el aprendizaje automático no significa que deba serlo. 1. Hacer predicciones basadas en tendencias 2. Detectar valores atípicos 3. Ahorrar tiempo 4. Visualizar y priorizar datos complejos John F. Wu es astrónomo asistente en el Instituto de Ciencias del Telescopio Espacial y científico investigador asociado en la Universidad Johns Hopkins. Si le pareció interesante y desea que los académicos y el personal de la universidad reciban consejos e información directamente en su bandeja de entrada cada semana, suscríbase al boletín de THE Campus.