Últimas noticias

Moliendo hacia la Industria 4.0

Inicio Calendario

Mar 08, 2023

¿Podrían las fundiciones de cuarzo sintético mejorar el rendimiento de la máquina?

Mar 10, 2023

Festool lanza un juego

Mar 12, 2023

Revisión: Alfombrilla de apisonamiento Normcore Espresso

Mar 14, 2023

El aprendizaje automático es demasiado caro para los archivos estatales

Jan 19, 2024

Miré en_Mis/Getty Images

Suscríbete a nuestro boletín

Mantente conectado

Por Chris Teale

Habiendo planeado inicialmente usar el aprendizaje automático para ayudar a los archivistas a clasificar montones de datos, los Archivos del Estado de Oregón implementarán análisis de datos avanzados en medio de preocupaciones sobre el costo y la madurez de la tecnología ML.

Los funcionarios de archivos publicaron a fines del año pasado una solicitud de propuestas que pedían tecnología ML para ayudar a procesar datos mediante la eliminación de duplicados y cualquier elemento que no sea pertinente, mientras se indexan para facilitar el acceso futuro. La RFP fue impulsada por la salida del cargo de la ex gobernadora Kate Brown y la esperada transmisión a los archivos estatales de hasta 10 terabytes de datos de sus ocho años como gobernadora.

Pero las respuestas a la RFP obligaron a los funcionarios a repensar, dijo Kristofer Stenson, gerente de registros estatales en los Archivos del Estado de Oregón, durante la Cumbre de Modernización y Tecnología Emergente de Nextgov y GCN. Al menos una oferta por el contrato de ML tenía un precio tres veces mayor que el presupuesto bienal completo de los archivos, lo que Stenson describió como "revelador".

"No lo llamaría una adquisición fallida, ya que aprendimos mucho de eso", dijo Stenson. Dada la necesidad de que la tecnología madure aún más y los precios bajen, los líderes estatales decidieron "alejarse" del ML.

En cambio, Stenson dijo que Oregón utilizará análisis de datos avanzados para procesar los registros de los archivos gubernamentales de Brown. Esa tecnología ayudará a identificar y eliminar cualquier duplicado, así como información confidencial, como números de Seguro Social y números de teléfono. También ofrece búsqueda avanzada para buscar en los archivos.

Ese esfuerzo, dijo Stenson, es "mucho más factible a corto plazo" y dentro del presupuesto actual. Otras agencias de Oregón usan herramientas de análisis similares, por lo que existe un precedente para que los archivos las usen por ahora como un "trampolín" hacia el aprendizaje automático completo en el futuro.