El aprendizaje automático es demasiado caro para los archivos estatales
Miré en_Mis/Getty Images
Suscríbete a nuestro boletín
Mantente conectado
Por Chris Teale
Habiendo planeado inicialmente usar el aprendizaje automático para ayudar a los archivistas a clasificar montones de datos, los Archivos del Estado de Oregón implementarán análisis de datos avanzados en medio de preocupaciones sobre el costo y la madurez de la tecnología ML.
Los funcionarios de archivos publicaron a fines del año pasado una solicitud de propuestas que pedían tecnología ML para ayudar a procesar datos mediante la eliminación de duplicados y cualquier elemento que no sea pertinente, mientras se indexan para facilitar el acceso futuro. La RFP fue impulsada por la salida del cargo de la ex gobernadora Kate Brown y la esperada transmisión a los archivos estatales de hasta 10 terabytes de datos de sus ocho años como gobernadora.
Pero las respuestas a la RFP obligaron a los funcionarios a repensar, dijo Kristofer Stenson, gerente de registros estatales en los Archivos del Estado de Oregón, durante la Cumbre de Modernización y Tecnología Emergente de Nextgov y GCN. Al menos una oferta por el contrato de ML tenía un precio tres veces mayor que el presupuesto bienal completo de los archivos, lo que Stenson describió como "revelador".
"No lo llamaría una adquisición fallida, ya que aprendimos mucho de eso", dijo Stenson. Dada la necesidad de que la tecnología madure aún más y los precios bajen, los líderes estatales decidieron "alejarse" del ML.
En cambio, Stenson dijo que Oregón utilizará análisis de datos avanzados para procesar los registros de los archivos gubernamentales de Brown. Esa tecnología ayudará a identificar y eliminar cualquier duplicado, así como información confidencial, como números de Seguro Social y números de teléfono. También ofrece búsqueda avanzada para buscar en los archivos.
Ese esfuerzo, dijo Stenson, es "mucho más factible a corto plazo" y dentro del presupuesto actual. Otras agencias de Oregón usan herramientas de análisis similares, por lo que existe un precedente para que los archivos las usen por ahora como un "trampolín" hacia el aprendizaje automático completo en el futuro.
Artículos relacionados
El aprendizaje automático profundiza en los archivos de los estados
Condado rural pone registros de tierras en blockchain
Gestión de registros electrónicos de pruebas de pandemia
"Todavía representa un gran paso adelante para nosotros y, con suerte, también nos permitirá brindar acceso más directo a estas colecciones pronto", dijo Stenson.
Los archivos también se encuentran en medio de una conversación sobre cómo almacenar los terabytes de documentos, comunicaciones y otros datos del mandato de Brown, que incluyó liderar la respuesta del gobierno estatal a la pandemia de COVID-19. Stenson dijo que la solución probablemente será un enfoque híbrido con almacenamiento en la nube y local para proporcionar redundancia.
Lidiar con la gran cantidad de datos electrónicos generados por los funcionarios electos es un problema que deben enfrentar todos los archivos estatales. Stenson dijo que ML pronto será una "herramienta crítica" para administrar esa información.
"Esto es real, ya no es un sueño de fantasía", dijo Stenson. "Este es el mundo en el que vamos a vivir. Si bien es posible que aún no hayamos llegado allí, lo estamos logrando bastante rápido".
Para los funcionarios de adquisiciones, el episodio ha mostrado el estado de madurez de la tecnología ML y el costo para que los gobiernos la utilicen. Stenson dijo que si bien Oregón "puede haberse apresurado un poco" al pedir soluciones de ML ahora, es mejor pensar en el futuro en las tecnologías emergentes en lugar de retrasarse. "Prefiero mirar hacia adelante que llegar cinco años tarde", dijo.
PRÓXIMA HISTORIA:La innovación prospera cuando los gobiernos adoptan asociaciones público-privadas de última generación
PRÓXIMA HISTORIA: