Una estrategia para la conservación de colecciones de documentos históricos con el uso de tecnologías de detección de temas
An approach for curating collections of historical documents with the use of topic detection technologies
Medina Andresel, y otros
International journal of digital curation, ISSN 1746-8256, Vol. 17, n. 1, 2022
La curación digital de materiales disponibles en grandes repositorios en línea es un requisito que permite la reutilización de recursos del patrimonio cultural en actividades específicas como la educación o la investigación científica. La digitalización de objetos tan valiosos es una tarea importante para hacerlos accesibles en plataformas digitales como Europeana. Por lo tanto, asegurar el éxito de las campañas de transcripción a través de la plataforma Transcribathon es un objetivo muy importante. Basándose en los resultados de evaluaciones de impacto, las personas se comprometen más con el proceso de transcripción si los contenidos se orientan a temas específicos, tales como la I Guerra Mundial. Actualmente los esfuerzos por agrupar documentos relacionados en colecciones temáticas son en general una tarea personal, y debido a la amplia acumulación de nuevos materiales, es difícil mantenerlos actualizados. Las soluciones actuales basadas en la recuperación de textos no permiten el descubrimiento de contenidos relacionados, ya que las colecciones existentes están en diferentes lenguas y contienen objetos heterogéneos como tarjetas postales, cartas, periódicos, fotografías, etc. Los avances tecnológicos en la comprensión lenguaje natural y en la gestión de datos han llevado a la automatización de la categorización de documentos a través de la detección automática de temas. Para utilizar tecnologías de detección de temas existentes en Europeana, hay varios retos que afrontar: asegurar datos de formación representativos y cualitativos; asegurar la calidad de los temas aprendidos y soluciones eficientes y escalables para la búsqueda de contenidos relacionados basados en los temas detectados automáticamente, y para proponer los temas más relevantes de nuevos objetos. El artículo describe en detalle cada uno de estos retos y propone soluciones ofreciendo una nueva perspectiva sobre cómo las prácticas de curación digital pueden enriquecerse con la ayuda de las tecnologías de aprendizaje de máquina.
http://www.ijdc.net/article/view/819
Traducción del resumen de la propia publicación