Minería de textos para clasificación por tipo de investigación
Text mining for type of research classification
David B. Lowe, y otros
Cataloging & classification quarterly, ISSN 1544-4554, Vol. 59, n. 8, 2021, p. 815-834
Este proyecto reunió a estudiantes de diplomatura en Ciencias Computacionales con bibliotecarios para realizar minería de resúmenes de artículos del repositorio institucional de la biblioteca de la Texas A&M University, OAKTrust, para poner a prueba la creación de nuevos metadatos que mejoraran la posibilidad de descubrimiento y el uso.
La tarea de minería consistió simplemente en clasificar los artículos en dos categorías de tipo de investigación: investigación básica (“para comprender”, “basada en la curiosidad” o “basada en el conocimiento”) e investigación aplicada (“basada en el uso”). Estas categorías son fundamentales especialmente para los financiadores, pero también son importantes para los investigadores. Los pasos que van de la minería a la clasificación llevaron varios intentos, pero al final se consiguieron buenos resultados con la herramienta BERT (Bidirectional Encoder Representations from Transformers). El proyecto y su flujo de trabajo representan un adelanto de lo que puede suponer en el futuro la producción de metadatos usando técnicas de minería de textos para enriquecer la posibilidad de descubrir.
https://www.tandfonline.com/doi/full/10.1080/01639374.2021.1998281
Traducción del resumen de la propia publicación