Universidad de Salamanca

FACULTAD DE TRADUCCIÓN Y DOCUMENTACIÓN
UNIVERSIDAD DE SALAMANCA

José Antonio Merlo Vega

ARTÍCULOS


 

Localización, identicación y descripción de recursos web: tentativas hacia la normalización

Comunicación publicada en las Jornadas Españolas de Documentación (7. 2000. Bilbao). Bilbao: Universidad del País Vasco, FESABID, 2000, p. 221-231.

Eva María Méndez Rodríguez (Universidad Carlos III de Madrid)
José Antonio Merlo Vega (Universidad de Salamanca)

 

Resumen

La explosión del número de usuarios en Internet y el crecimiento continuado del volumen de los contenidos accesibles a través de la World Wide Web hacen que la valiosa información electrónica alojada en la web sea inconsistente y difícil de localizar. Por este motivo se están desarrollando distintos proyectos de normalización de la información distribuida en Internet, tanto para la identificación de los recursos, como para su estructuración, acceso y referencia. En la presente comunicación se analizan estas tentativas de estandarización relativas a los sistemas de identificación y localización, a la descripción de los contenidos y a la descripción formal de los recursos web. Este trabajo pretende ofrecer una panorámica del estado de la cuestión en materia de localización, identificación y descripción de documentos web, así como de reflexionar en torno a la normalización en este sentido.

 

Palabras clave: Normalización / Internet / Información web / Localización de recursos / Descripción de recursos / Identificación de recursos.

 

 

Introducción

    La documentación ha sido desde siempre una disciplina con un alto componente normativo, tanto para la identificación como para la descripción del conocimiento contenido en las diversas publicaciones. Los bibliotecarios y/o documentalistas hemos utilizado y utilizamos normas por varios motivos evidentes: para incrementar la calidad y la consistencia de la información, para mejorar la compatibilidad de estructuras de datos o para facilitar tanto la recuperación como el intercambio de información. Las normas bibliográficas tradicionales que hemos adoptado en la labor de la gestión de la información son aquellas que, al aplicarse a una colección de información almacenada, organizan y facilitan el acceso a los registros de conocimiento y a su contenido intelectual. Estos, amén de la tradición normativa generalizada, son aspectos que nos llevan a pensar en normas similares para le Red. Sin embargo, el proceso de estandarización formal, tal y como está establecido en el mundo impreso, es insuficiente para ajustarse a las necesidades y al desarrollo acelerado de la información contenida en Internet; por ello proliferan distintas tentativas de normalización que pretenden convertirse en estándares de facto para la web.

    La WWW no es más que un universo de información complejo, distribuido, heterogéneo, cambiante, dinámico, y poco uniforme. Todas estas características se justifican desde el punto de vista que en la web, se puede acceder a distintos tipos de información (texto, imágenes, vídeo, sonido, software, etc.) en distintas lenguas, sobre las temáticas más heterogéneas, sin diferenciar la información científica, de la comercial o de la meramente divulgativa, la imagen del sonido, lo importante de lo accesorio y siempre a través de un ordenador. Además toda esa información heteróclita se encuentra distribuida en distintos nodos por todo el mundo, sin ningún criterio documental apriorístico de organización de la información; a ello se une el aumento exponencial de la web que dificulta aún más su estructuración; día a día varía el número de páginas en Internet, los contenidos de las existentes, otras desaparecen, y toda esta mutación informacional es constante, diaria y vertiginosamente cambiante. Quizás esta falta de uniformidad de esa maraña de información web se deba a que no existe ninguna estandarización universalizada que estructure la información identificadora, ni de la forma ni del contenido de las páginas web.

    Por todo ello, en esta comunicación pretendemos dar a conocer sistemáticamente las principales tentativas de estandarización que están ocupando muchos Mb de información tanto en la web como en los distintos foros de discusión relacionados con ellas. En primer lugar revisaremos las iniciativas que tratan de solucionar el problema de la inconsistencia de ubicación de los recursos web, esto es, las "normas" que están surgiendo en torno a la localización e identificación de documentos electrónicos; en segundo lugar nos ocuparemos del prolijo mundo de los metadatos a través del análisis de los distintos modelos que se están proponiendo para la estructuración y definición del contenido web; y por último, pero no por ello menos importante, reflejaremos la problemática que comporta la referencia y descripción formal de estos recursos electrónicos a través de los proyectos normativos que se están desarrollando al respecto.

 

La localización e identificación de documentos web

Desde antaño han existido iniciativas para identificar los documentos y poder localizarlos entre un conjunto. Bibliografías, catálogos, etc. han pretendido la identificación de los documentos, al tiempo que indicaban dónde podían encontrarse. Para ello se desarrollaron normas de descripción y catalogación, así como sistemas de acceso al documento. Para la identificación y localización de los archivos telemáticos se parte de objetivos semenjantes; incluso, la necesidad es aún mayor, dada la profusión de documentos que están presentes en Internet y la facilidad con la que se incorporan páginas nuevas. Parece lógico, por tanto, que se desarrollen métodos eficaces para localizar un documento concreto en la gran "biblioteca" de Internet. Son muchos los proyectos llevados a cabo con esta finalidad, incluso algunos se están aplicando con gran éxito y difusión. En este apartado se comentarán las principales actuaciones realizadas por organismos de relevancia para identificar a un documento web de forma única, inequívoca y persistente y para poder localizarlo de forma sencilla. A continuación se exponen los proyectos más importantes:

La descripción de contenidos web

Hablar de la descripción de contenidos web, implica hablar del "tan de moda" y complejo mundo de los metadatos o metainformación. Los recursos electrónicos pueden y deben ser una parte integral de las colecciones de las bibliotecas modernas, por ello, establecer sistemas robustos de acceso a esa información electrónica tiene una importancia crítica en el desarrollo de las incipientes "bibliotecas digitales". Desde hace aproximadamente cinco años, diversos colectivos están desarrollando modelos o pseudo-estándares de metadatos, con distintos niveles de difusión, para describir sus colecciones digitales, otros están esperando a la madurez de estos formatos para implemetarlos de una forma más fácil y sólida en sus sistemas de información, otros servicios tratan de solucionar la incorporación de documentos web a través del campo 856 del formato USMARC.

A una definición tan sencilla y manida como "datos sobre los datos", podemos añadir que los metadatos en el contexto de Internet, son informaciones estructuradas sobre la información distribuida, todos aquellos datos comprensibles por el ordenador, estructurados de tal forma que sirven para localizar, identificar y describir el contenido de un documento web, y por ende, para recuperar información en la Red. No obstante, los diversos modelos de metadatos no son normas en el amplio sentido de la palabra responden más bien a proyectos de desarrollo de normas o a estándares de facto en determinadas comunidades de usuarios. Analizaremos a continuación algunos de los más importantes modelos en este sentido.

La descripción de formal de documentos electrónicos

La descripción externa de los recursos electrónicos, podría verse implícita en la descripción del contenido a través de metadatos, en tanto que éstos presumen una catalogación o descripción, también formal, de los documentos web. Sin embargo, en este apartado nos vamos a ocupar de algo más allá de la descripción formal bibliotecaria, trataremos las formas de hacer referencias "bibliográfica" relativas a la electrónica accesible en Internet. La necesidad de contar con normativa en este sentido es interesante no sólo en el ámbito bibliotecario, sino para cualquier disciplina que utilice información de la web para avalar sus trabajos o proyectos científicos.

Los manuales y guías de estilo para la descripción de documentos se están adaptando a los documentos electrónicos. Muchas de las normas tradicionales de descripción formal, como las ISO, Chicago, Harvard, etc., han incorporado pautas para aplicar a páginas web, mensajes de correo electrónicos, revistas digitales, etc. Además, universidades y otras entidades están realizando sus aportaciones al tema, ya sea ampliando a estos nuevos documentos normas ya clásicas, o bien creando estándares para afrontar la nueva realidad de los documentos electrónicos. Sin embargo, el mayor problema en la descripción formal, en la redacción de las referencias de estos documentos proviene justamente de la falta de estructuración del contenido informativo de los recursos electrónicos. A pesar de que existe un gran número de orientaciones sobre como describir la información electrónica, fundamentalmente web, la mayor parte de las mismas se basan en un reducido número de normas, como son las de la ISO, la MLA, la APA o Havard, siendo las demás adaptaciones de las anteriores. En los párrafos siguientes se detallarán las mismas, con la intención de diferenciar unos métodos de otros.

Conclusiones y reflexiones finales

A tenor de lo que se ha expuesto a lo largo de esta breve comunicación, las conclusiones parecen evidentes: en la Red proliferan los proyectos y tentativas de normalización de la información web para poder recuperarla, compartirla y hacerla compatible. Esta plétora de estándares o proyectos de normalización en desarrollo, denota el estado incipiente del tema de la ubicación, identificación y descripción de documentos web, que dista mucho de contar con un estándares sólidos, fiables e internacionalmente reconocidos.

 

 Bibliografía general

Ahronheim, Judy . Judy and Magda´s List of Metadata Initiatives. [en línea]. 2 nov. 1997. Disponible en Internet <http://www-personal.umich.edu/~jaheim/alcts/bibacces.htm> [Consulta: 20 julio 2000]

Berners Lee, Tim. Tejiendo la red: el inventor del World Wide Web nos descubre su origen. Madrid: Siglo veintiuno, 2000

Burnard, Lou and light, Richard. Three SGML metadata formats: TEI, EAD, and CIMI. En: Work Package 1 of Telematics for Libraries project BIBLINK (LB4034). [en línea] rev. 14 may 1998. Disponible en Internet <http://www.ukoln.ac.uk/metadata/BIBLINK/wp1/sgml/> [Consulta: 20 julio 2000]

Causton, Laurie. Identifying and describing web resources [en línea]. 17 nov. 1998. Disponible en Internet < http://www.elpub.org/html/webres.html > [Consulta: 4 julio 2000]

Connolly, Dan. Naming and addressing: URIs, URLs, … [en línea]. 8 mar. 2000. Disponible en Internet < http://www.w3.org/Addressing > [Consulta: 4 julio 2000]

Crane, N. B. Bibliographic formats for citing electronic information [en línea]. 29 oct. 1997. Disponible en Internet < http://www.uvm.edu/~ncrane/estyles > [Consulta: 4 julio 2000]

Crouse, Maurice. Citing electronic information in history papers [en línea]. 7 sep. 1999. Disponible en Internet < http://www.people.memphis.edu/~mcrouse/elcite.html > [Consulta: 4 julio 2000]

Dempsey, Lorcan and Heery, Rachel. Metadata: a current view of practice and issues. Journal of Documentation, March 1998, vol. 54, n. 2, p. 145-172

eLib Standards Guideliness. Lorcan Dempsey, et al. [en línea]. Version 2.0, 27 oct. 1998. Disponible en Internet <http://www.ukoln.ac.uk/services/elib/papers/other/standards/version2/> [Consulta: 20 julio 2000]

Estivill, Assumpció; Urbana, Cristóbal. Cómo citar recursos electrónicos [en línea]. 30 may. 1997. Disponible en Internet < http://www.ub.es/div5/biblio/citae-e.htm > [Consulta: 4 julio 2000]

Fletcher, Gordon; Greenhill, Anita. Academic referencing of Internet-based resources [en línea]. Abr. 1997. Disponible en Internet < http://www.spaceless.com/WWWVL/refs.html > [Consulta: 4 julio 2000]

Haigh, Susan. Glossaire des normes, des protocoles et des formats liés à la bibliothèque numérique [en línea]. 6 may. 1998. Disponible en Internet: <http://www.nlc-bnc.ca/pubs/netnotes/fnotes54.htm> [Consulta: 20 julio 2000]

Heery, Rachel. D1.1 Metadata Formats En: WP Study of Metadata, issue 1.0. [en línea] 23 dic. 1996. Disponible en Internet <http://hosted.ukoln.ac.uk/biblink/wp1/d1.1.rtf> [Consulta: 20 julio 2000]

IFLA. Citating guides form electronic documents [en línea]. 30 sep. 1999. Disponible en Internet < http://www.ifla.org/I/training/citation/citing.htm > [Consulta: 4 julio 2000]

IFLA. Digital libraries: metadata resources [en línea]. 19 may. 2000. Disponible en Internet <http://www.ifla.org/II/metadata.htm> [Consulta: 20 julio 2000]

Li, X.; Crane, N.B. Electronic styles: a handbook for citing electronic information. Medford, NJ: Information today, 1996.

Lagonze, Carl . The Warwick Framework: A container architecture for diverse sets of metadata. D-Lib Magazine [en línea] July/August 1996. Disponible en Internet http://www.dlib.org/dlib/july96/lagonze/07lagonze.html [Consulta: 20 julio 2000]

Lynch, Clifford. Identifiers and their role in networked information applications. A Bimonthly Newsletter of Research Library Issues and Actions [en línea]. Issue 195, 29 dic. 1997. Disponible en Internet < http://www.arl.org/newsltr/194/identifier.html > [Consulta: 4 julio 2000]

Méndez Rodríguez, Eva Mª. RDF: un modelo de metadatos flexible para las bibliotecas digitales del próximo milenio. En: Jornades Catalanes de Documentació. Barcelona: Col.legi Oficial de Bibliotecaris-Documentalistes de Catalunya, 1999, p. 487-498. Disponible también en Internet <http://www.bib.uc3m.es/~mendez/publicaciones/7jc/rdf.htm>

Paskin, Norman. Information identifiers [en línea]. 9 abr. 1998. Disponible en Internet < http://www.elsevier.nl/inca/homepage/about/infoident > [Consulta: 4 julio 2000]

Powell, Andy. Unique identifiers in a digital world. [en línea]. Ariadne, vol.8, 8 abr. 1997. Disponible en Internet < http://www.ariadne.ac.uk/issue8/unique-identifiers > [Consulta: 4 julio 2000]

Tong, Josie. Citation style guides for Internet and electronic sources [en línea]. 14 feb 2000. Disponible en Internet < http://www.library.ualberta.ca/library_html/help/pathfinders/style/style.html > [Consulta: 4 julio 2000]

Turabian, Kate L. A manual for writers of term papers, theses, and dissertations. 5th ed. Chicago: University of Chicago Press, 1987.

World wide web consortium. Resource Description Framework (RDF): Model and Syntax Specification. W3C Recommendation, 22 February 1999 [en línea]. Ora Lassila and Ralph R. Swich, eds. 22 feb. 1999. Disponible en Internet < http://www.w3.org/TR/1999/REC-rdf-syntax-19990222 > [Consulta: 20 julio 2000]

World Wide Web Consortium. Resource Description Framework (RDF) Schema Specification 1.0 W3C Candidate Recommendation 27 March 2000 [en línea]. Dan Brickley, R.V. Guha, eds. 27 mar. 2000. Disponible en Internet <http://www.w3.org/TR/2000/CR-rdf-schema-20000327/> [Consulta: 20 julio 2000]

 

Sitios Web relacionados

American Psychological Association

APA

Http://www.apa.org/journals/webref.html

Http://owl.english.purdue.edu/Files/34.html

Dublin Core Metadata

DC

Http://purl.org/DC/

Digital Object Identifier System

DOI

Http://www.doi.org/

Encoded Archival Description

EAD

Http://lcweb.loc.gov/ead/

Content Standards for Digital Geospatial Metadata

FGDC

Http://www.fgdc.gov/Metadata

Government Information Locator Service

GILS

Http://www.gils.net

Handle System

HS

Http://www.handle.net

ISO 690-2

ISO

Http://www.nlc-bnc.ca/iso/tc46sc9/standard/690-2e.htm

Modern Language Association

MLA

Http://www.mla.org/publications/stylemanual_index.htm

Platform for Privacy Preferences

P3P

Http://www.w3.org/P3P/

Platform for Internet Content Selection

PICS

Http://www.w3.org/PICS/

Publisher Item Identifier

PII

Http://www.elsevier.nl/inca/homepage/about/pii/

Persistent Uniform Resource Locator

PURL

Http://purl.org/

Resource Description Framework

RDF

Http://www.w3.org/RDF

Serial Item and Contribution Identifier

SICI

Http://sunsite.berkeley.edu/SICI/

Text Encoding Initiative

TEI

Http://www-tei.uic.edu/orgs/tei/

Http://etext.virginia.edu/TEI.html

Uniform Resource Identifiers Working Group

URI

Http://www.ics.uci.edu/pub/ietf/uri/

Uniform Resource Name Working Group

URN

Http://www.ietf.org/html.charters/urn-charter.html

eXtensible Markup Language

XML

Http://www.w3.org/XML

 

 


http://exlibris.usal.es/merlo/escritos/bilbao2.htm
José Antonio Merlo Vega

merlo@gugu.usal.es
22 febrero 2001