Recuperación y Organización de la Información

Metadatos y documentos XML/RDF para recuperación

Metadatos

Los «metadatos» son «datos sobre datos». Consisten en datos estructurados y codificados que describen características de la información contenida para ayudar a identificar, descubrir, valorar y administrar las instancias descritas.


Distinción entre datos y metadatos

No siempre es sencillo establecer un diferenciación clara entre datos y metadatos. Por ejemplo, un poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado a una canción que lo usa como texto.

En una buena cantidad de ocasiones, los datos son tanto "datos" como "metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato referente al texto(Dato como Metadato).


Metadatos sobre metadatos

Dado a que los metadatos son datos en sí mismos, existe la posibilidad de definir metadatos sobre metadatos. Pese a que en un primer momento esto puede parecer innecesario, los metadatos sobre metadatos pueden aportar gran utilidad.


Objetivos

La manera de emplear los metadatos más habitual es la optimización de consultas a buscadores. Definiendo informaciones adicionales los resultados son más certeros, y se evita en un cierto número de casos que el usuario debe filtrar manualmente los resultados de la búsqueda.

A nivel semántico, existe el problema de que el usuario y el ordenador no se entiendan el uno al otro porque la máquina no sea capaz de entender el significado de los datos. Puede que los metadatos hagan posible dicha comunicación estableciendo cómo están relacionados los datos.


Clasificación

Se clasifica metadatos usando tres criterios:

  • Contenido. Subdividir metadatos por su contenido es lo más común. Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso. Es posible subdivir estos dos grupos más veces, por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso.
  • Variabilidad. Según la variabilidad se puede distinguir metadatos mutables e inmutables. Los inmutables no cambian, no importa qué parte del recurso se vea, por ejemplo el nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido de un vídeo.
  • Función. Los datos pueden ser parte de una de las tres capas de funciones: subsimbólicos, simbólicos o lógicos. Los datos subsimbólicos no contienen información sobre su significado. Los simbólicos describen datos subsimbólicos, es decir añaden sentido. Los datos lógicos describen cómo los datos simbólicos pueden ser usados para deducir conclusiones lógicas, es decir añaden comprensión.


Vocabularios controlados y ontologías

Para garantizar la uniformidad y la compatibilidad de los metadatos, muchos sugieren el uso de un vocabulario controlado fijando los términos de un campo. Por ejemplo, en caso de sinónimos o interlenguaje hay que acordarse qué palabras se usan para evitar que el buscador localice «español» pero no «española».

Una ontología además define las relaciones de los términos del vocabulario para que la computadora puede evaluarlas automáticamente. Así es posible presentar una página web sobre «Vincent van Gogh» aunque el usuario tecleó «pintores neerlandeses»; usando una ontología adecuada el buscador comprende que van Gogh fue un pintor neerlandés.

Un concepto muy similar a las ontologías son las folksonomías. Las ontologías son definidas por expertos del campo que ordenan los términos, pero las folksonomías son definidas por los mismos usuarios.

Página creada por Eduardo Galán Herrero

Última Actualización: 19-09-2007

Valid XHTML 1.0 Strict Recuperacion y organizacion de la informacion Recuperacion y organizacion de la informacion- Nivel WAI - AA recuperacion y organizacion de la informacion TAW. Nivel doble A. WCAG 1.0 WAI Metadatos y documentos XML/RDF para recuperación [Valid RSS]