An assessment of arabic transliteration systems

An assessment of arabic transliteration systems
17 de Septiembre de 2012

David R. Lawson

 

Technical Services Quarterly, Vol. 27, n. 2, 2010

La transliteración de escrituras no latinas a escrituras latinas es un proceso complejo puesto que los caracteres y la fonética son muy diferentes entre sí: caracteres que no tienen correspondencia con el idioma latino (en el caso que muestra el artículo, con el inglés); caracteres que, según su posición, pueden tener formas diferentes, etc. En muchas ocasiones, la transliteración se resuelve utilizando signos diacríticos que no son nativos de ninguno de los dos idiomas implicados. Esto complica el acceso a los documentos puesto que una búsqueda en la que se utilicen únicamente caracteres latinos no recuperará resultados que utilicen estos signos diacríticos. Existen muchos sistemas de transliteración. El artículo evalúa seis de esos sistemas teniendo en cuenta la exactitud de la transliteración (fidelidad de la pronunciación del carácter o caracteres y signos diacríticos con la letra arábiga original) y la usabilidad (uso de signos diacríticos o no). Cada sistema de los evaluados recibe una puntuación sobre las variables mencionadas. Los sistemas son: 1) ISO 233-2: presenta una exactitud fonética elevada pero tiene carencias en cuanto a la usabilidad; los gobiernos árabes y el gobierno estadounidense actualmente no utilizan este sistema. 2) Qalam: no utiliza signos diacríticos sino que pone letras mayúsculas cuando quiere enfatizar por algún motivo la pronunciación, aunque el resultado en cuanto a pronunciación no es tan ajustado como con los signos. 3) SATTS: es un método morse latino utilizado por los militares y las compañías de comunicaciones; no utiliza diacríticos aunque presenta múltiples problemas de fonética. 4) Arabic Chat Alphabet (Arabesh): es el lenguaje que utilizan los árabes parlantes en el entorno tecnológico que no soporta el árabe vernáculo. No usa diacríticos y presenta inexactitudes fonéticas. 5) Buckwalter: se utiliza para representar cadenas ortográficas exactas en árabe. No usa diacríticos y sí mayúsculas. Su principal inconveniente es que hay algunos casos en los que la pronunciación no tiene nada que ver con la original. 6) ALA-LC/UNGEGN: aunque son dos sistemas distintos, la similitud que hay entre ellos permite evaluarlos de manera conjunta. Utiliza signos diacríticos no nativos y es muy exacto en cuanto a fonética. Presenta una anomalía y es que omite una letra que es muy utilizada (el alif). Una vez considerados y evaluados estos aspectos, el sistema que obtiene una mayor puntuación en Qalam, seguido muy de cerca por ALA-LC/UNGEGN. El autor sugiere la posibilidad de inclinarse todos los sistemas a favor de uno solo de manera que se pueda ofrecer a los no lingüistas el mejor acceso posible a información escrita en árabe transliterado.

Resumen elaborado por: Isabel Mª Domingo Montesinos

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.