Diseño e implementación del primer servicio genérico de almacenaje de archivos para datos de investigación en Alemania
Design and Implementation of the first Generic Archive Storage Service for Research Data in Germany
Felix Bach, Björn Schembera, Jos van Weze
International Journal of Digital Curation, ISSN 1746-8256, Vol. 15, n. 1, 2020
Los datos de investigación, como un bien valioso en la ciencia, deben ser salvaguardados y subsecuentemente encontrables, accesibles y reutilizables por razones de una conducta científicamente apropiada por un periodo de tiempo de varios años. Sin embargo, gestionar un almacenaje a largo plazo de los datos de investigación es una carga para instituciones e investigadores.
Debido a su tamaño y a la conservación requerida, los proveedores de almacenaje son difíciles de encontrar. Para solventar este problema, el proyecto bwDataArchive comenzó a desarrollar un archivo de datos de investigación a largo plazo que es confiable, rentable y capaz de almacenar múltiples petabytes de datos. El hardware consiste en un almacenaje de cintas magnéticas, integrado con cachés y nodos de disco para el movimiento y acceso de datos. Por su parte, el software, High Performance Storage System (HPSS), fue elegido por su probada capacidad de almacenaje confiable de grandes cantidades de datos. Sin embargo, la implementación de bwDataArchive no depende de HPSS. Para su autenticación, bwDataArchive se integró en la gestión de identidades federada para las instituciones educacionales en el estado de Baden-Württemberg en Alemania. El archivo proporciona la protección de los datos a través de una copia dual en dos lugares distintos con diferentes tecnologías de cinta, accesibilidad a los datos con protocolos habituales de almacenaje, conservación asegurada durante más de diez años, preservación de datos con suma de verificación y capacidades de gestión de los datos apoyada por una estructura de directorio flexible que permite compartir y publicar. En septiembre de 2019 bwDataArchive tenía unos fondos de 9 petabytes y 90 millones de archivos, y mantiene un incremento constante de su utilización por usuarios de muchas comunidades.
http://www.ijdc.net/article/view/553
Traducción del resumen de la propia publicación