Metadata

De UMAIC Wiki
(Redirigido desde «Inventario de metadatos»)
Saltar a: navegación, buscar

Un metadato esta definido como datos sobre datos. Aunque esta definición es facil de recordar, no es muy preciso. La fortaleza de esta definición es en reconocer que el metadato también es un dato. Como tal, el metadato puede ser almacenado y manejado entre una base de datos, frecuentemente nombrado un registro o repositorio. Sin embargo, es imposible identificar al metadato solo por mirarlo. No sabemos cuando un metadato es un metadato o solamente datos.[1]

Los metadatos son un concepto que aplica principalmente a datos archivados electrónicamente y utilizados para describir:

  1. una definición
  2. una estructura
  3. la administración de archivos de datos con todos sus contenidos en un contexto para facilitar el uso de los datos capturados para uso en el futuro.

Las paginas web frecuentemente incluyen a metadatos en el formato de "metatags". Metatags con descripciones y palabras claves se utiliza en muchos casos para describir el contenido de una página Web. La mayoría de buscadores utilizan a estos datos cuando agregan a paginas a su índice de búsqueda.

Definición de metadatos

La definición de metadatos ofrece información sobre varios elementos, tales como:

  • medio de creación,
  • propósito de los datos,
  • tiempo y fecha de creación,
  • creador o autor del dato,
  • ubicación de una red en donde se creó los datos,
  • que estándar se utiliza

En varios formatos, los metadatos han sido utilizados como un medio de catalogar la información archivada. Un ejemplo de una forma antigua de los metadatos es el Sistema Dewey utilizado por las bibliotecas para indexar los libros. En este sistema, los datos encontrados en tarjetas incluyeron el nombre del libro, su autor, el tema, un resumen pequeño y tipicamente un sistema alfanumérico abreviado indicando la ubicación del libro en repisas particulares. Tal dato permite clasificar, agregar e identificar los libros para encontrarlos rapidamente.

Creación de los metadatos

Los metadatos pueden ser generados a través de procesamiento de información automatizado o con trabajo manual. Metadatos elementales capturados por los computadores pueden incluir informació nsobre cuando se creó un archivo, quien lo creó, cuando fue actualizado la última vez, su tamaño y su extensión.

Estructuras de metadatos

Los metadatos tipicamente se estructuran según conceptos estandardizados utilizando una esquema bien definida, incluyendo: estandares de metadatos y modelación de metadatos. Herramientas como vocabulario controlado, taxonomía, tesaurus, diccionarios de datos y un registro de metadatos pueden ser utilizados para estandardizar los metadatos aún más.

Sintaxis de metadatos

Los sintaxis de los metadatos hacen referencia a las reglas creadas para estructurar los campos o elementos de los metadatos.[2] Una sola esquema de metadatos puede ser expresada por varios lenguajes de programación, cada uno con sintaxis diferente. Por ejemplo, Dublin Core puede ser expresado en texto plano, HTML, XML y RDF.[3]

Tipos de Metadatos

Dado que la aplicación de los metadatos es variada cubriendo varios campos de aplicación, hay modelos especializados y aceptados en su agrupación para especificar los tipos de metadatos. Bretheron y Singley distinguen entre dos clases distintos: metadatos estructurales/control y metadatos de guía.[4] Metadata estructural se utiliza para describir la estructura de sistemas de computación tales como tablas, columnas e indices. Metadatos de guía se utiliza para ayudar a los seres humanos encontrar a itemes específicos y normalmente se expresa con un conjunto de palabras claves en lenguaje natural. Según Ralph Kimball, los metadatos se puede dividir entre 2 categorias parecidas - metadatos tecnicos y metadatos de negocios. Metadatos tecnicos corresponden a metadatos internos, metadatos de negocios a metadatos externos. Kimball agrega una tercera categoría nombrada metadatos de procesos. Por otro lado, NISO distingue entre tres tipos de metadatos: descriptivos, estructurales y administrativos.[5] Metadatos descriptivos incluyen a la información utilizada para buscar y ubicar un objeto tal como el título, el autor, los temas, las palabras claves, la casa editorial; metadatos estructurales da la descripción de cómo los componentes del objeto están organizados; y metadatos administrativos hacen referencia a la información técnica incluyendo el tipo de archivo. Los dos sub-tipos de metadatos administrativos incluyen a metadatos de manejo de derechos y metadatos de preservación.

Esquema jerárquica, linear y planar

Las esquemas de los metadatos pueden ser jerárquicas en su naturaleza en donde relaciones existen entre los elementos de los metadatos y los elementos están ubicados tales como relaciones padre-hijo existen entre los elementos. Un ejemplo de una esquema jerárquico de metadatos es el de metadatos de objetos de aprendizaje, en donde los elementos de los metadatos pueden ser poseídos por un elemento 'padre' del metadato. Las esquemas de los metadatos también pueden ser unidimensional, o linear, en donde cada elemento es totalmente discreto con respecto a los demás elementos y clasificados por un solo elemento. Un ejemplo de la esquema linear de metadatos es Dublin Core. Las esquemas de los metadatos frecuentemente incluyen a dos dimensiones, es decir que son planares, en donde cada elemento es totalmente discreto con respecto a los demás elementos pero clasificados según los dos dimensiones ortogonales.[6]

Hipermapeo de los metadatos

En todos los casos en donde las esquemas de los metadatos pasan la representación planar, algún tipo de hipermapeo es necesario para permitir la visualización de los metadatos según el aspecto escogido y para servir vistas especiales. El hipermapeo frecuentemente se aplica a la nivelació nde la información geográfica o geológica.[7].

Granularidad

La granularidad es un termino que aplica a los datos tanto como a los metadatos. El grado hasta donde los metadatos están estructurados se refiere como su granularidad. Los metadatos con alto nivel de granularidad permite una estructura de información mas profunda y mayores niveles de manipulación técnica. Sin embargo, un nivel más bajo de granularidad significa que los metadatos pueden ser creados por un costo considerablemente menor pero no dará una información tan detallada. El impacto mayor sobre la granularidad no es solamente en cuanto a su creación y captura, pero además en su mantenimiento. Tan pronto que se desactualice las estructuras de los metadatos, el acceso a los datos referidos se desactualizan. Por ende, la granularidad tomará en cuenta el esfuerzo de creación además de los esfuerzos para mantenerlo.

Estandares de metadatos

Existen estandares internacionales que son aplicables a los metadatos. Se han logrado mucho en comites nacionales e internacionales de estandares para asi llegar a consensos sobre la estandardización de los metadatos y registros.

El estándar más básico es el ISO/IEC 11179-1:2004[8] y estandares subsecuentes (ver ISO/IEC 11179). Todos los registros publicados hasta el momento según este estándar cubren unicamente la definición del metadato y no sirven para estructurar el almacenamiento de los metadatos o su acceso ni tampoco la estandardización administrativa.

Uso de Metadatos

Estadísticas y Servicios del Censo

El trabajo de estandardización ha tenido un gran impacto sobre los esfuerzos de crear sistemas de metadatos en la comunidad de estadístas. Varias estándares de metadatos han sido elaborados y su importancia a las organizaciones de estadísticas, como el DANE, se ha discutido. El énfasis es sobre el impacto de un registro de metadatos en una organización de estadísticas.

Las ciencias de información y bibliotecología

Las bibliotecas digitales utilizan a metadatos en un sistema de manejo de bibliotecas. Los metadatos se utilizan como un medio de catalogar los recursos como los libros, las revistas, los trabajos, CDs, y DVDs. Estos datos se almacenan en un sistema integrado de manejo de biblioteca, utilizando estándares MARC. El propósito es poder buscar para acceso rapido en revistas electrónicas, libros electrónicos y sitios Web.

La estándardización para el funcionamiento de las bibliotecas es un tema clave en la estandardización internacional ISO desde hace varias decadas. Los estandares de los metadatos en las bibliotecas digitales incluyen a Dublin Core, METS, MODS, DDI, DOI, PREMIS y OAI-PMH. Las bibliotecas más reconocidas del mundo dan pistas sobre sus estrategias en los estandares de los metadatos.[9], [10].

Metadatos en el Internet

El formato HTML se utiliza para definir las paginas web. Esto permite la inclusión de una serie de tipos de metadatos, desde textos básicos descriptivos, fechas y palabras claves hasta esquemas de metadatos más complejas tales como Dublin Core, e-GMS, y AGLS.[11] Las paginas también pueden utilizar geotags con las coordenadas geográficas. Los metadatos pueden ser incluidos en la cabeza de la pagina o en un archivo separado. El microformato permite que los metadatos pueden ser agregados entre los datos en la pagina de una manera que los usuarios no lo ven, pero los computadores pueden acceder facilmente.

Vale la pena anotar que muchos buscadores son cautelosos en utilizar los metadatos en los algoritmos de ranking dada la posibilidad de explotar los metadatos y la práctica de optimización frente a los buscadores para mejorar su posicionamiento.

Metadatos Geoespaciales

Los metadatos que describen los objetos geográficos (tales como conjuntos de datos, mapas, objetos o simplemente documentos con un componente geoespacial) tienen una historia desde por lo menos 1994 (ver MIT Library page on FGDC Metadata). Esta clase de metadatos son los metadatos geoespaciales.

Administración y Manejo de Metadatos

Almacenimiento de los Metadatos

Los metadatos pueden ser almacenados internamente, en el mismo archivo con los datos, o externamente, en un archivo aparte. Los metadatos ubicados con el contenido también se refiere como metadatos en nido. Un repositorio de datos tipicamente almacene los metadatos removidos de los datos. Ambos formatos tienen sus ventajes y sus desventajas:

  • Almacenimiento interno permite transferir los metadatos conjuntamente con los datos que describe; así, los metadatos siempre están a la mano y pueden ser manipulados facilmente. Esta metodología crear alta redundancia y no permite juntar los metadatos.
  • Almacenimiento externo permite juntar los metadatos, por ejemplo en una base de datos, para buscar de manera más eficiente. No existe redundancia y los metadatos pueden ser transferido simultáneamente cuando se envíe. Sin embargo, dado que muchos formatos utilizan URIs, la metodología de como se conecta los metadatos con sus datos debe ser tratado con cuidado. Cuando un recurso no tiene un URI, los metadatos solamente pueden ser evaluados cuando existe una conexión al Internet, particularmente en RDF. Así puede ser dificil dar cuenta de que un recurso está reemplazo por otro con el mismo nombre pero otro contenido.

También existe una cuestión de formato de los datos: almacenar los metadatos en un formato leíble por las personas, como XML dado que los usuarios puede entenderlo y editarlo sin herramientas especializadas. Pero por otro lado, estos formatos no están optimizados para capacidad de almacenimiento; puede ser útil almacenar los metadatos en codigo binario para mejorar transferencias y reducir el uso de la memoria.

Manejo de Bases de Datos

Cada base de datos relacional tiene sus propios mecanismos para almacenar los metadatos. Ejemplos de base de datos relacionados con sus metadatos incluyen:

  • Tablas de todas las tablas en una base de datos, sus nombres, tamaños y el número de filas en cada tabla.
  • Tablas de las columnas en cada base de datos, en qué tablas se utilice, y los tipos de los datos almacenados en cada columna.

En terminología de base de datos, este conjunto de metadatos se conoce como el catálogo de la base de datos. El estándar SQL especifica que uniforme significa acceso al catálogo, llamado la esquema de información, pero no todas las bases de datos lo implementan, incluso si implementan otros aspectos del estándar SQL. Para un ejemplo de metodologias de acceso de metadatos específicos a las bases de datos, anota los metadatos de Oracle. El acceso programático a los metadatos es posible utilizando APIs tales como JDBC o SchemaCrawler.[12]


Referencias

  1. METADATA STANDARDS AND METADATA REGISTRIES: AN OVERVIEW
  2. Plantilla:Cite web
  3. Plantilla:Cite web
  4. Plantilla:Cite conference
  5. Error en la cita: Etiqueta <ref> inválida; no se ha definido el contenido de las referencias llamadas NISO
  6. Plantilla:Cite web
  7. [www.isprs.org/proceedings/XXXII/part4/www.ifp.uni.../kuebler51.pdf THE DESIGN AND DEVELOPMENT OF A GEOLOGIC HYPERMAP PROTOTYPE]
  8. ISO/IEC 11179-1:2004 Information technology - Metadata registries (MDR) - Part 1: Framework
  9. Library of Congress Washington DC on metadata
  10. [www.d-nb.de/standardisierung/.../metadaten.htm Deutsche Nationalbibliothek Frankfurt on metadata]
  11. National Archives of Australia, AGLS Metadata Standard, accessed 07 January 2010, [1]
  12. Plantilla:Cite web


Links Externos

Plantilla:Wiktionarypar