The structure and content of MARC 21 records in the Unicode environment
Joan M. Aliprand
Information Technology and Libraries, Vol. 24, n. 4, 2005
Artículo en el que se analizan los distintos juegos de caracteres que pueden utilizarse en los registros del formato MARC 21. Los registros MARC 21 pueden estar codificados en juegos de caracteres individuales o en UNICODE. La mayoría de los juegos de caracteres individuales codifican un único alfabeto junto con sus signos de puntuación. Actualmente, son doce los juegos de caracteres individuales que pueden utilizarse en los registros MARC 21. A comienzos de los años 80, el chino, el japonés y el coreano (CJK) en sus correspondientes alfabetos, fueron incorporados a la Red de Información de Bibliotecas de Investigación (RLIN). Éste fue uno de los primeros usos de los alfabetos no latinos en los registros bibliográficos legibles por ordenador. Para facilitar el intercambio de registros en CJK se idearon dos opciones con objeto de incluir los datos escritos en estos alfabetos en los registros del USMARC (ahora MARC 21). Estas dos opciones se denominaron Modelo A y Modelo B. En el Modelo A, el alfabeto latino se utiliza como alfabeto preferente, de forma que todos los campos se rellenan con datos en caracteres latinos (se realiza una romanización, es decir, la información escrita en caracteres no latinos se convierte a caracteres latinos) excepto los campos 880 que se utilizan para la representación gráfica alternativa. Por el contrario, en el caso del Modelo B, los campos se rellenan en el alfabeto que corresponda ya que el alfabeto latino no se utiliza como preferente. Ambos modelos están recogidos en el MARC 21, pero el Modelo A está mucho más extendido y es el modelo utilizado para la exportación de registros en alfabetos no latinos por el RLG, OCLC y la Library of Congress.
Resumen elaborado por: Mayte Blasco Bermejo