De la biblioteca digital a los conjuntos de datos abiertos. Adoptar un marco de 'Collections as data”
From digital library to open data sets. Embracing a “Collections as data” framework
Rachel Wittmann, Anna Neatrour, Rebekah Cummings, Jeremy Myntti
Information Technology and Libraries, ISSN 2163-5226, Vol. 38, n. 4, 2019, p. 49-61
Se analiza el movimiento conocido como “Collections as data”. Se trata de una corriente de investigación en alza en el campo de las bibliotecas y las humanidades digitales que pretende poner en valor la investigación de las colecciones digitales más allá del uso que tradicionalmente se les ha dado, así como proporcionar a los investigadores un acercamiento a los datos más flexible, facilitando el acceso a la información subyacente. Obtener acceso a datos de alta calidad es un desafío clave
en el trabajo de las humanidades digitales, ya que los objetos de estudio de las humanidades no suelen ser tan susceptibles a los métodos computacionales como los datos de las ciencias y las ciencias sociales. La University of Utah’s Marriott Library está desarrollando estrategias de “Collections as data” aprovechando los programas existentes para el tratamiento de colecciones digitales de los departamentos Digital Library y Digital Matters con el fin de explorar diferentes estrategias para desarrollar conjuntos de datos abiertos, tales como la minería de textos, el topic modeling (clasificación de documentos) y el SIG (Sistema de Información Geográfica). Se describen cinco casos prácticos con los que se intenta ampliar la investigación de las colecciones digitales: un proyecto de minería de texto sobre una colección de historias orales relacionadas con la minería; una colección de datos basados en la Harold Stanley Sanders Matchbooks Collection que incluye la geolocalización de los establecimientos referenciados; el mantenimiento de una variedad de registros de personal de la Kennecott Copper Miner, de modo que esa información esté preparada para ser utilizada en posibles futuras investigaciones; un análisis multimodal de 6.800 páginas del Woman's Exponent, un periódico para mujeres de Utah publicado entre 1872 y 1914; y un proyecto de indexación de la información genealógica recogida en los obituarios de los periódicos del Estado de Utha.
https://ejournals.bc.edu/index.php/ital/article/view/11101
Resumen elaborado por María Osuna González