lunes, octubre 06, 2008

Modificaciones a las Reglas de Catalogación y la Infraestructura de OCLC para una Organización Efectiva de los Recursos de Internet

Ingrid Hsieh-Yee
Profesor, Escuela de Bibliotecología y Ciencias de la Informacion
Universidad Católica de América, Washington, D.C.
hsiehyee@cua.edu

Traducción por
Filiberto Felipe Martínez -Arellano
Investigador, Centro Universitario de Investigaciones Bibliotecológicas
Universidad Nacional Autónoma de México
felipe@cuib.laborales.unam.mx

--------------------------------------------------------------------------------


Este trabajo originalmente apareció en "Proceedings of the OCLC Internet Cataloging Colloquium, San Antonio, Texas, January 1996" y es traducido y reproducido con la correspondiente autorización. Copyright, OCLC Online Computer Library Center, Incorporated, 1996, 1997. Todos los derechos reservados.
Título original: Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources


--------------------------------------------------------------------------------




Contenido
Introducción
Porque las bibliotecas y los catalogadores deberán efectuar esta tarea
Como catalogar los recursos de Internet
Descripción
Puntos de Acceso
Análisis temático
La infraestructura de OCLC
Conclusión
Referencias

--------------------------------------------------------------------------------




Introducción
La dinámica naturaleza de los recursos de Internet representa un gran reto para los organizadores de la información. Una página web puede ser cambiada de lugar dentro del mismo sitio, desplazada a otro diferente, o bien, desaparecer por completo; su conte nido puede ser actualizado ligera o substancialmente en un periodo muy corto; a medida de que la gente cambia, diferentes grupos de trabajo pueden tener la responsabilidad de las páginas; el auspicio institucional puede cambiar y nuevos métodos de acceso pueden ser agregados a un documento después de su aparición inicial. Adicionalmente, la falta de normalización en la presentación de la información dentro de la World Wide Web complica la tarea de los organizadores de la información. Por ejemplo, la menc ión de responsabilidad puede ser vaga o estar implícita dentro del mismo documento, el título puede no ser descriptivo o específico y la información referente a su publicación, a veces necesita ser inferida. Estos retos nos llevan a reconsiderar como los recursos de Internet pueden ser representados y organizados de una mejor manera.




Porque las bibliotecas y los catalogadores deberán de efectuar esta tarea
La necesidad de organizar la información que existe en Internet es atestiguada por la serie de encomiables esfuerzos que varios investigadores han hecho para lograr un control de dicha información. La mayoría de los motores de búsqueda que actualmente existen fueron desarollados por profesionales de la computación. La emoción inicial generada por estas herramientas motivó que algunos usuarios llegaran a la conclusión de que el problema que representaba organizar la información dentro de Internet estaba resuelto. Sin embargo, una vez que el efecto de la novedad había pasado, los usuarios se dieron cuenta, rápidamente, de la impresición de tales herramientas. Algunos diseñadores como Martin Coster [1] han enumerado sus limitaciones y advertido contra un a total confianza en ellas. Otro gran intento para organizar la información de Internet ha sido la identificación del núcleo de elementos que pueden constituir los metadatos de un documento para describirlo y hacerlo accesible. El "encabezamiento se mántico" [2], el "núcleo de Dublin" [3] y las " características uniformes de recursos" [4], son algunos de los ejemplos más conocidos del producto de las deliberaciones entre computólogos, bibliotecólogos, editores, vendedores, a rchivistas e ingenieros. Sin embargo, es un tanto incomprensible que muy pocos catalogadores hayan sido involucrados en estos esfuerzos, a pesar de que durante mucho tiempo son quienes han tenido a su cargo la identificación de los metadatos para elaborar los registros de información (actividad que ha sido llamada catalogación dentro de la Bibliotecología). El paralelismo que existe entre las especificaciones para registrar estos metadatos y aquellas utilizadas en los registros de catalogación salta a pri mera vista. Por otro lado, los esfuerzos que se han hecho para adaptar el encabezamiento TEI (Text Coding Initiative) al formato MARC [5], son evidencias de que las normas y métodos utilizados en la catalogación tienen mucho que contribuir a la organizac ión de los recursos que existen en Internet.

Los principios sobre los que se basa la organización de la información [6] son:

La determinación de que recursos existen y la selección de aquellos que son relevantes para las necesidades de los usuarios.
La descripción de los recursos seleccionados.
El proporcionar los puntos de acceso necesarios, incluyendo el control de autoridad de los mismos.
El análisis del contenido de los recursos seleccionados.
El proporcionar la información necesaria para la localización de esos recursos.

En comparación con los motores o los servicios de búsqueda en Internet, las bibliotecas están mejor preparadas para llevar a cabo la selección de recursos electronicos debido a la experiencia que han obtenido en la adquisición de materiales en diversos fo rmatos para sus usuarios. La experiencia de los bibliotecólogos en la selección de los recursos y el conocimiento de los componentes de su comunidad, les aseguraran el éxito en la evaluación y selección de los recursos que existen en Internet. En particul ar, los catalogadores deberán de ser involucrados en la organización de estos recursos puesto que han aplicado los principios de la organización bibliográfica a la catalogación de materiales en diversos formatos, y por lo tanto, son capaces de aplicar est os principios a la catalogación de los recursos de Internet con igual eficiencia.




Como catalogar los recursos de Internet
¿Como deberá de ser realizada esta actividad? A partir de la catalogación de 160 documentos de Internet durante un periodo de dos meses, nos dimos cuenta que utilizar un nivel de catalogación completo era una tarea que requería de mucho tiempo. Adicional mente, algunos de los elementos señalados para el segundo nivel de descripción en las RCA2, podrían ser de poca utilidad para los usuarios. Resultaba evidente que para adaptarse a la naturaleza dinámica de los recursos de Internet, un nivel de descripción diferente debería de ser derivado de las actuales reglas. Por lo anterior y con el fin de lograr un balance entre la rapidez en la creación de un registro y su calidad, así como entre esa rapidez y un pronto acceso a los recursos de Internet, un nivel d e catalogación mínima es propuesto. Este nivel (mencionado de aquí en adelante como nivel de catalogación M) tiene como objetivo apoyar el papel del catálogo como una herramienta de búsqueda, una herramienta de evaluación y un mecanismo de localización d e los recursos de Internet a través de la inclusión de aquellos datos esenciales para su identificación y ubicación temática. El nivel de catalogación M sigue las reglas de puntuación especificadas en las RCA2 e incluye las 8 áreas señaladas para el segun do nivel de descripción. Sin embargo, algunos elementos han sido simplificados. Los problemas y soluciones (P&S) que se discuten a continuación, muestran la forma en la cual pueden ser registrados los datos.




Descripción

Area 1: Título y mención de responsabilidad
Fuentes prescritas de información: La pantalla más antigua.

La transcripción del título propiamente dicho deberá de ser realizada en la forma prescrita por la regla 1.1B1 de las RCA2. La fuente del título deberá de ser incluida en una nota para ayudar al usuario a entender el registro.

P&S: Si la mención de responsabilidad no está prominentemente mencionada en la fuente principal de información, ésta puede ser omitida del Area 1. Evite la utilización de información entre paréntesis para este elemento. En lugar de lo anterior , utilize una nota general para incluir aquella información sobre los autores que se encuentre implícita en cualquier otra parte del documento.

Los llamados "diseñadores web," quienes codifican un documento, deberán de ser tratados como editores. Inclúyalos en el Area 1 si son mencionados de una manera prominente en la fuente principal de información. Las RCA2 referentes a la mención de hasta tr es individuos, son aplicables para registrar a los autores y editores de este tipo de documentos.

Designación general del material: Un nuevo término, [Archivo de Internet], es utilizado para distinguir los recursos de Internet de los archivos de computadora almacenados en otro tipo de dispositivos para acceso directo. Los usuarios podrán utilizar este nuevo DGM para restringir sus búsquedas a los recursos de Internet.

Area 2: Edición
Fuentes prescritas de información: Las pantallas que se encuentran antes y después del cuerpo del documento (este concepto es similar a los "preliminares" y "colofón" dentro de las monografias .)

P&S: Frecuentemente, los recursos que existen en Internet no incluyen una mención formal de edición. Esta área puede ser omitida si no existe ninguna información disponible. Cuando los datos de la edición son incluidos en un documento de Inter net, éstos tienden a aparecer en las primeras o en las últimas pantallas. El registro de las menciones formales de edición sigue la regla 1.2B1.

Como diversos participantes en Intercat señalan, sí cada mención de actualización fuese tratada como una mención de edición, sería necesario crear un nuevo registro bibliográfico cada vez que un documento fuese puesto al día [7]. La confusión resu ltante de tal práctica desvirtuaría el objetivo de la catalogación. Por lo anterior, a diferencia de lo mencionado en las RCA2 y en el documento Cataloging Internet Resources : A Manual and Practical Guide [8], las actualizaciones no deberán de s er tratadas como otras ediciones; tal información puede ser incluida en una nota general (véase las indicaciones en la parte correspondiente).

Area 3: Características del archivo
Los términos especificados dentro de las RCA2 para esta área no proporciona información única para identificar o localizar los recursos de Internet. Por lo anterior, esta área es omitida del nivel de catalogación M .

Area 4: Publicación, Distribución, etc.
Fuentes prescritas de información: Las pantallas que se encuentran antes y después del cuerpo del documento (este concepto es similar a los "preliminares" y "colofón" dentro de las monografias .)

P&S: En muchas ocasiones, la información correspondiente al área de publicación necesita ser inferida y a veces la información incluida en la pantalla que contiene el título es diferente a la correspondiente al sitio donde se encuentra el docum ento. Por ejemplo, un autor cuya institución es la Catholic University of America, podría tener una página en el web de la University of North Carolina. La solución a esta situación es tomar el sitio donde se encuentra la página como el ed itor e incluir, opcionalmente, la afiliación del autor en una nota general. La fundamentación para este tratamiento es que el sitio anfitrión proporciona un foro para que el autor presente sus ideas. Sí la información correspondiente al área de publicaci ón no aparece en las fuentes prescritas de información , ésta deberá de ser registrada entre corchetes.

Fecha de Publicación : Dado que muchos de los recursos de Internet son actualizados frecuentemente, la fecha de actualización es cambiante y por lo tanto no deberá de ser utilizada como la fecha de publicación [9]. Siguiendo el tratamiento que se aplica a las publicaciones que se actualizan constantemente a través de hojas substituibles, es recomendable que la fecha inicial de aparición de un documento web, sí es conocida, se registre con un guión para indicar que éste se encuentra en constante a ctualización. Sí la fecha de publicación no se incluye en las fuentes prescritas de información, ésta deberá de ser registrada entre paréntesis.

Area 5: Descripción Física
Esta área es omitida del registro para recursos de acceso remoto.

Area 6: Serie
Fuentes prescritas de información: Cualquier parte del documento. Unicamente se registran el título formal de la serie y la información correspondiente a la numeración.

Area 7: Notas
Fuentes prescritas de información: Cualquier parte del documento

El área 7 proporciona información de gran utilidad, la cual complementa la información incluida en las primeras 6 áreas del registro.

P&S: Las notas deberán de ser incluidas, de acuerdo a su importancia, en el siguiente orden:

7.11 Campo 856. Localización y acceso electrónico

Dado que el principal interés de muchos usuarios es como accesar un documento, esta nota deberá de ir en primer lugar.

7.12 Múltiples campos 856: Una nota deberá de ser empleada para para cada uno de los diferentes métodos de acceso.

7.13 Mantenimiento de los URL: En ocasiones, los URL cambian o son modificados. Su mantenimiento puede se hecho a través del PURL (Persistent Uniform Resources Locator) de OCLC [10].

7.21. Fuente del título. Una nota requerida.

7.22 Variantes del título: Incluye información como el título HTML o los títulos tomados de otras fuentes.

7.31 Información sobre el autor: Si la mención de responsabilidad no es registrada en el Area 1, una nota sobre el autor deberá de ser incluida sí esta información se localiza en cualquier otra parte del documento. Los editores y diseñadors de webs pueden ser incluidos en esta nota, la cual deberá de contener las fuentes de donde se tomó tal información. La regla para la mención de hasta tres individuos, también es aplicable a autores, editores y diseñadores de webs.

7.32 Otras personas u organismos: Aquí se registran las personas u organismos no incluidos en la mención de responsabilidad pero considerados importantes para la identificación de los documentos .

7.41 Actualidad de la información [11]: De manera similar al tratamiento de las publicaciones seriadas y las publicaciones actualizadas por hojas substituibles, se deberá de incluir una nota para indicar la fecha de creación del registro. Por ejemplo:

Descripción basada en : versión de Febrero 15, 1995.
Esta nota le indicará al usuario la fecha en la cual el registro fue creado y le ayudará a entender y aclarar cualquier discrepancia entre el registro y un documento de Internet recuperado posteriormente por el usuario.

7.42 Actualizaciones al registro: Sí el catalogador decide actualizar un registro, la información corrrespondiente a la fecha de la última actualización deberá de ser incluida para ayudar al usario a entender los cambios en el registro. Por ejemplo:

Actualización del registro basada en: versión de Junio 30, 1995.
Los catalogadores que decidan no actualizar los registros no necesitan utilizar esta nota.

7.51. Requerimientos del sistema (campo 538): Esta nota puede ser simplificada incluyendo únicamente el equipo y programación especiales que son necesarios para accesar un documento. Por ejemplo, impresora postscript o interfase para gráficas

7.52 Modo de acceso (Campo 538): Esta información es duplicada con la incluida en el campo 856 y por lo tanto puede ser omitida.

7.6 Nota de Contenido/Resumen: Algunos catalogadores han optado por incluir las partes que integran un documento (contenido); sin embargo, un resumen cuidadosamente elaborado, generalmente es más informativo que una larga lista de contenido y por lo tanto deberá de preferirse.

Area 8. Números normalizados y términos de disponibilidad
Esta área no se encuentra actualmente en uso. Se podrá utilizar para registrar el URN (Nombre Uniforme de Recursos) cuando éste se encuentre disponible.
Con base en todo lo anteriormente expuesto, un registro para un documento de Internet puede ser tan completo como un registro bibliográfico de segundo nivel de catalogación, sí todos los elementos pueden ser identificados y registrados; o bien, puede ser tan corto como el registro que se muestra a continuación:


Titulo propio [Archivo de Internet] / Mención de responsabilidad
. -- [Lugar de la institución anfitriona del documento: Nombre
de la institución anfitriona del documento, Fecha inicial del docu
mento - ]
Nota de localización y acceso. (Campo 856)
Fuente del título. (Nota 500)
Editores u organismos importantes para fines de identificación.
(Nota 500)
Actualidad de la información. (Nota 500)
Actualizaciones del registro. (Nota 500)
Requerimientos del sistema. (Nota 538)
Resumen. (Nota 520)



Cambios en los campos 500 (notas) del formato MARC: Para simplificar el mantenimiento de la información incluida en las diversas etiquetas 500, una serie de valores númericos deberán de ser creados para utilizarse como indicadores y especificar la naturaleza de cada una de las notas registradas en las diferentes etiquetas 500. Sí esto es difícil de lograr, otro campo deberá de ser utilizado para registrar la actualidad y actualización de la información correspondiente a cada una de las notas.




Puntos de Acceso
Los puntos de acceso para cada uno de los autores, editores y organismos (no más de tres de cada tipo) directamente relacionados con la producción de un documento, deberán de ser incluidos. Adicionalmente, el trabajo de autoridad respectivo deberá de ser realizado.




Análisis temático
Dado que el contenido de la mayoría de los documentos que existen en Internet tiende a ser amplio, la opción tradicional de sintetizar dicho contenido parece ser la adecuada para este tipo de recursos. Los catalogadores necesitarán combinar el uso de un vocabulario controlado en los encabezamientos de materia con la utilización de un lenguaje natural dentro del resúmen y proporcionar a los usuarios diversas opciones en la recuperación de los recursos de Internet a través del tema que abordan. Adicionalme nte, todos los términos utilizados como elementos de recuperación temática deberán de estar sujetos a un trabajo de control de autoridad. Las listas de encabezamientos tradicionales como LCSH, MeSh y Sears, así como los esquemas de clasificación de Dewey y LC, deberán de continuar siendo utilizados para lograr una integración de los documentos de Internet con otros recursos que existen en la colección y lograr una ubicación por materia uniforme.




La infraestuctura de OCLC
Aunque es deseable contar con un sistema de información que organize todo lo que existe en Internet, actualmente tal sistema no es factible ni podría ser efectivo por las siguientes razones:

Existen demasiados recursos en Internet.
La calidad de muchos de esos recursos es cuestionable.
Muchos recursos son de naturaleza efímera y pueden ser de escazo valor para los usuarios.

Un modelo que podría tener un mayor costo-efectividad, sería un sistema que incluyera aquellos recursos cuya calidad hubiese sido evaluada previamente. La actual infraestructura de OCLC permite que las bibliotecas seleccionen los recursos que son relevan tes para sus usuarios y contribuyan con los registros originales de esos recursos, en el caso de que no existan en OCLC. A través de este proceso, las bibliotecas tienen la ventaja de utilizar el Archivo de Autoridad de Autores y el Catálogo de Autoridad de Materia de la Biblioteca del Congreso, así como el módulo de creación de registros de OCLC. Por otra parte, las reglas seguidas para la catalogación de los recursos de Internet son esencialmente las mismas que aquellas utilizadas para la creación de re gistros originales en OCLC, exepto que la parte descriptiva ha sido substancialmente simplificada.

Los esfuerzos cooperativos de las bibliotecas permitirán a los bibliotecólogos identificar una gran cantidad de los recursos de Internet que son de calidad. Los registros bibliográficas incluirán aquellos puntos de acceso e información temática que les so n de utilidad a los usuarios en la búsqueda y selección de los recursos que existen en Internet. Asimismo, contarán con las relaciones o ligas, actualizados a través de PURLs, para recuperar fácilmente aquellos recursos seleccionados por los usuarios. U n sistema de información con tales caracteristicas, podrá ser reconocido por la calidad de sus registros y efectividad para recuperar la información, y por lo tanto, preferido por los usuarios. Dado que tal sistema sería potencialmente rentable, las bibli otecas y OCLC podrían compartir su administración. Mínimamente, tres categorías de usuarios, los cuales tendrían que cubrir una serie de cargos con base en su relación con OCLC, pueden ser identificados. Primeramente, las bibliotecas que contribuyan con r egistros originales al nuevo sistema obtendrían los créditos correspondientes y las cuotas de acceso al sistema podrían ser substancialmente reducidas. Estas bibliotecas podrían tener la opción de no incluir ligas o relaciones desde sus OPACs. Segundo, las bibliotecas que no contribuyeran con registros a OCLC, pero desearan copiarlos a sus respectivos OPACs o únicamente efectuar búsquedas en el sistema, tendrían que cubrir una cuota. Tercero, aquellos usuarios finales que prefieren tener acceso directo a OCLC a través de Internet, cubrirían una cuota fija por un conjunto de búsquedas para estimular e incrementar el uso del sistema. El sistema podría ser colocado en Internet y competir con otros motores y servicios de búsqueda. Las utilidades que el sis tema pueda generar, serían utilizadas para apoyar su desarrollo y a las bibliotecas que contribuyan con registros.




Conclusión
Los recursos que existen en Internet necesitan ser evaluados, seleccionados, descritos y analizados temáticamente para facilitar su acceso. Por mucho tiempo, los catalogadores han estado agregando un valor añadido a los medios para registrar información y los principios utilizados dentro de la organizacion de la información pueden ser efectivamente aplicados para organizar los recursos de Internet. Los registros que integren el catálogo de estos recursos, deberán de incluir aquellos elementos que son esen ciales para su identificación y localización. Debido a la gran cantidad de este tipo de recursos, la mejor opción para crear este catalogo es a través de un esfuerzo cooperativo. Para lograr lo anterior, un nivel de catalogación mínimo ha sido propuesto y el papel que OCLC podría jugar en esta tarea ha sido señalado. Los bibliotecólogos con su experiencia en las actividades de catalogación y OCLC con su infrestructura de información, podrían ser aliados para mejorar la búsqueda, el acceso y la utilización de los recursos que existen en Internet.




Referencias
Martijn Koster, "Robots in the Web: Threat Or Treat," [http://info.webcrawler.com/mak/projects/robots/threat-or-treat.html]
Binp C. Desai, "WWW Workshop: Navigation Issues," [http://www.cs.concordia.ca/bcd/navigate.html]
Para una descripción del "Núcleo de Dublin", véase Priscilla Caplan, "You Call It Corn, We Call It Syntax-Independent Metadata for Document-Like Objects," Public-Access Computer Systems Review 6, no. 4 (1995): 19-23; y un resumen del OCLC/NCSA Metadata Workshop at [ http://www.cnri.reston.va.us/home/dlib/July 95/07weibel.html]
Ron Daniel, "Proposed URC External Representation," [http://www.acl.lanl.gov/URI/ExtRep/urc0.html]
Véase por ejemplo, "TEI Guidelines for Electronic Text Encoding and Interchange," [http://etext.virginia.edu/TEI.html]
Principios similares fueron discutidos por Arlene G. Taylor en "The Information Universe: Will We Have Chaos or Control?" American Libraries 25 (1994): 629-32.
El problema del sitio web y la mención de responsabilidad fueron discutidos en la lista de Intercat en Octubre de 1995 por Neil R. Hughes, Angelina G. Joseph, Glenn Patton, y Ellen McGrath. Los mensajes se encuentran almacenados en el archivo de la lista de discusión en http://ftplaw.wuacc.edu/listproc/intercat/9510/maillist.html
Cataloging Internet Resources: A Manual and Practical Guide, ed. Nancy B. Olson. Dublin: OCLC, 1995.
Adele Hallam, Cataloging Rules for the Description of Looseleaf Publications: with Special Emphasis on Legal Materials. 2a. ed. Washington, D.C.: Office for Descriptive Cataloging, Library of Congress, 1989.
El concepto de PURL fue introducido por Erik Jul y discutido en la lista de Intercat en Enero de 1996 por Erik Jul, Vianne Sha, Priscilla Caplan, y Stuart Weibel. Los mensajes están almacenados en el archivo de la lista en http://ftplaw.wuacc.edu/listproc/intercat/9601/maillist.html
Hallam, Cataloging Rules for the Description of Looseleaf Publications.

No hay comentarios.: