Conoce Atico34 - Solicita presupuesto
Glosario

Metadatos. Definición, funciones y ejemplos

Si buscaste en Google “metadatos” y encontraste este artículo, has utilizado metadatos. Cuando le compraste a tu madre un regalo de Amazon, usaste metadatos. ¿Te conectaste con un colega a través de LinkedIn? Los metadatos estaban en funcionamiento. ¿Tu solución de Spotify por la tarde? Sí, lo adivinaste, usaste metadatos. Analizamos aquí qué son los metadatos, sus características, tipos, funciones y principales ejemplos.

¿Qué son los metadatos?

Los metadatos son datos sobre datos. En otras palabras, es información que se usa para describir los datos contenidos en algo como una página web, documento o archivo. Otra forma de pensar en los metadatos es como una breve explicación o resumen de lo que son los datos.

Un ejemplo simple de metadatos de un documento podría incluir una colección de información como el autor, el tamaño del archivo, la fecha en que se creó el documento y las palabras clave para describir el documento. Los metadatos de un archivo de música pueden incluir el nombre del artista, el álbum y el año de su lanzamiento.

Para los archivos de computadora, los metadatos se pueden almacenar dentro del archivo en sí o en otro lugar, como es el caso de algunos archivos de libros EPUB que mantienen los metadatos en un archivo ANNOT asociado.

Los metadatos representan información detrás de escena que se utiliza en todas partes, por todas las industrias, de múltiples maneras. Es omnipresente en los sistemas de información, las redes sociales, los sitios web, el software, los servicios de música y la venta minorista en línea. Los metadatos se pueden crear manualmente para seleccionar y elegir lo que se incluye, pero también se pueden generar automáticamente en función de los datos.

Los metadatos describen elementos HTML invisibles que comunican directamente y aclaran la información del sitio web para los motores de búsqueda, desempeñando un papel fundamental en la optimización eficaz del motor de búsqueda para los minoristas. Esta serie de microcomunicaciones incluye títulos de páginas, etiquetas de descripción y otros protocolos, y pueden describir propósitos, características y contenido general.

Son una forma estructurada de comunicar información sobre un conjunto de datos, que se utiliza en una variedad de entornos con especial relevancia para las empresas de comercio electrónico.

Etimología del término

La etimología de este término consta de dos palabras, una griega y otra latina. Por un lado la palabra griega “meta”, que significa después de o más allá de, y por otro lado el vocablo latino “datum”, que significa dato. Por tanto, la expresión metadatos significa más allá de los datos.

Según esta etimología, metadatos son un conjunto de datos que describen el contenido informativo de un recurso, de archivos o de información de los mismos. Es decir, es información que describe otros datos. Pero no existe una sola definición de metadatos, son varias las expresiones con las que se conoce, como informaciones sobre datos, informaciones sobre informaciones o datos sobre informaciones.

“Metadatos” es una palabra bastante nueva (apareció en la segunda mitad del siglo XX), mientras que “datos” se remonta a mediados del siglo XVII.

Características de los metadatos

Entre las principales características de los metadatos se encuentran las siguientes:

  • Son paquetes de información altamente estructurados que explican contenido, calidad y características de los datos del sitio web.
  • Son precisos y en muchos casos cortos e integrados por palabras simples.
  • Ofrecen puntos de acceso a la información del sitio web.
  • Codifican la descripción del sitio web.

¿Para qué sirven?

Los metadatos sirven para una variedad de propósitos, siendo el descubrimiento de recursos uno de los más comunes. Aquí, se puede comparar con una catalogación efectiva, que incluye identificar recursos, definirlos por criterios, reunir recursos similares y distinguir entre los que son diferentes.

También es un medio eficaz para organizar los recursos electrónicos, que es un uso importante dado el crecimiento de los recursos basados ​​en la Web. Normalmente, los enlaces a los recursos se han organizado como listas y se han creado como páginas web estáticas, con los nombres y recursos codificados en HTML. Sin embargo, una práctica más eficaz es utilizar metadatos para crear estas páginas. Para fines web, la información se puede extraer y reformatear mediante el uso de herramientas de software.

Otro uso de los metadatos es como un medio para facilitar la interoperabilidad y la integración de recursos. El uso de metadatos para describir recursos permite su comprensión tanto por humanos como por máquinas. Esto permite los niveles más efectivos de interoperabilidad, o cómo se intercambian datos entre muchos sistemas con plataformas operativas, estructuras de datos e interfaces dispares. A su vez, facilita la búsqueda de recursos en la red.

Los metadatos también facilitan la identificación digital a través de números estándar que identifican de forma única el recurso que definen los metadatos. En esta línea, otra práctica es combinar metadatos para que actúen como un conjunto de datos identificativos que diferencian objetos o recursos, apoyando las necesidades de validación.

Finalmente, los metadatos son una forma importante de proteger los recursos y su accesibilidad futura. Es una preocupación crítica dada la fragilidad de la información digital y su susceptibilidad a la corrupción o alteración. Para fines de archivo y preservación, toma elementos de metadatos que rastrean el linaje del objeto y describen sus características físicas y comportamiento para que pueda replicarse en tecnologías en el futuro.

Tipos de metadatos

Los metadatos son una herramienta a través de la que las empresas que dominan una gran cantidad de información obtienen la ayuda necesaria para organizar esa información y facilitar el trabajo de los usuarios, incrementando su productividad.

Estos son los principales tipos de metadatos:

Según su función

Según la función que tengan esos metadatos, se dividen en:

Lógicos

Son datos que explican de qué forma los datos simbólicos pueden utilizarse para hacer deducciones de resultados lógicos, por lo que se caracterizan por la compresión.

Simbólicos

Son los datos que detallan los datos subsimbólicos, por lo que introducen sentido.

Subsimbólicos

Son aquellos datos que no contienen ninguna información sobre su significado.

Según su variabilidad

En este caso, los metadatos se dividen en dos tipos:

Inmutables

Son los datos que no cambian independientemente de la parte del recurso que sea visible.

Mutables

Son los datos diferentes de los demás e incluso difieren de parte a parte.

Según su contenido

En este caso, los metadatos son fraccionados por su contenido. Así, se da la opción de diferenciar entre los metadatos que detallan el recurso en sí y los metadatos que describen el contenido de ese recurso.

¿Cuál es el ciclo de vida de los metadatos?

Los metadatos tienen un ciclo de vida que va detallando cada etapa por la que pasan, haciendo determinadas labores en cada una de ellas. Así, en este aspecto podemos diferenciar el ciclo de vida de los metadatos en tres fases:

  • Creación: en esta etapa es cuando se crean los metadatos. Estos pueden desarrollarse de diferentes maneras:
    • Manualmente: puede llegar a ser un procedimiento un tanto complicado, aunque todo depende del formato que se utilice y del volumen que se esté buscando. De todos modos, es más usada cualquiera de las otras dos formas de creación que detallamos a continuación.
    • Forma automática: en este caso, el software recibe toda la información requerida por sí solo, es decir, sin ningún tipo de ayuda externa. Sin embargo, a pesar de los avances tecnológicos en cuanto a los algoritmos que se emplean en este aspecto, es poco viable que el ordenador consiga por sí mismo, sacar todos y cada uno de los metadatos de manera automática. Así que esta forma tampoco llega a ser la más adecuada, aunque también se use de forma frecuente.
    • Forma semiautomática: esta es la manera ideal para crear metadatos. Mediante este sistema se establecen una serie de algoritmos autónomos que sostiene el usuario en cuestión y que no permiten que el software pueda sacar por sí mismo los datos deseados, sino que necesita ayuda externa para ello.
  • Manipulación: en esta fase se realizan cambios en determinados aspectos. Por ello, si los datos en cuestión cambian, los metadatos también deben cambiar y esto se realizará fácilmente y de manera automática, aunque hay ocasiones en las que se necesita ayuda humana para llevar a cabo esta labor.
  • Destrucción: como última fase que puede realizarse en la vida de los metadatos está la destrucción de los mismos. En este caso hay que estudiar bien la manera de hacerlo. Existen distintas formas de quitar metadatos. En determinadas ocasiones se eliminan los metadatos a la misma vez que sus recursos de manera conjunta. Sin embargo, hay otras situaciones en las que se conservan los metadatos por diferentes motivos, como por ejemplo para controlar las modificaciones en un documento.

¿Cómo se almacenan?

Los metadatos se pueden almacenar en una variedad de lugares. Cuando los metadatos se relacionan con bases de datos, los datos a menudo se almacenan en tablas y campos dentro de la base de datos.

A veces, los metadatos existen en un documento especializado o en una base de datos diseñada para almacenar dichos datos, denominada diccionario de datos o repositorio de metadatos. Hay algunos tipos de archivos de datos especializados que incluyen tanto los datos brutos como los metadatos.

De manera más general, los metadatos se pueden almacenar en cualquier lugar (por ejemplo, en correos electrónicos, cuestionarios, instrucciones de recopilación de datos u hojas de cálculo).

Ventajas de una correcta gestión de metadatos

Invertir en el desarrollo de metadatos puede generar beneficios en tres áreas clave:

  • Puede extender la longevidad de los datos. La vida útil de un conjunto de datos típico puede ser muy corta, a menudo porque los metadatos relevantes faltantes o no disponibles lo hacen inútil. Cuando se desarrollan y mantienen metadatos completos, se contrarresta la entropía y la degradación de datos típicas.
  • También facilita la reutilización y el intercambio de datos. Los metadatos son clave para garantizar que los datos muy detallados o complicados sean interpretados, analizados y procesados ​​más fácilmente por el creador de los datos y otros.
  • Los metadatos son esenciales para mantener registros históricos de conjuntos de datos a largo plazo, compensando las inconsistencias que pueden ocurrir en la documentación de datos, personal y métodos. También pueden permitir que los conjuntos de datos diseñados para un solo propósito se reutilicen para otros fines y a largo plazo.

Desarrollar y mantener metadatos puede ser una propuesta costosa. Existen costes asociados con la edición y publicación de datos y metadatos. Su administración y mantenimiento a largo plazo también puede resultar engorroso. Sin embargo, los metadatos son una inversión que puede no ser opcional en una era en la que la información es fundamental para la fuerza vital de una organización.

Ejemplos de metadatos

Aquí tienes un ejemplo detallado de metadatos.

Acabas de tomar una foto de un oso en el bosque. La subes a tu computadora y la colocas en tu base de datos de imágenes. Para encontrarlo rápidamente, utilizarás los descriptores de metadatos para buscar la foto en el futuro. Esto es especialmente importante porque tienes muchas otras fotografías de osos y quieres poder recordar algunas específicas.

Los metadatos ayudan a acotar su búsqueda utilizando descriptores que identifican la imagen. Primero, se anota la fecha en que se tomó la foto y el autor. Esta fecha da una buena base de dónde comenzar tu búsqueda de la imagen. A continuación, se pueden adjuntar a la imagen algunas palabras clave como oso o bosque. Estos son sus metadatos. Usando una combinación de las palabras clave de metadatos, podrás encontrar las imágenes exactas. Estos tipos de metadatos se incluyen en la categoría “descriptiva”.

Otros ejemplos de uso de metadatos son los siguientes:

Búsquedas de metadatos y sitios web

Los metadatos incrustados en los sitios web son de vital importancia para el éxito del sitio. Incluye una descripción del sitio web, palabras clave, metaetiquetas y más, todos los cuales juegan un papel en los resultados de búsqueda.

Algunos términos de metadatos comunes que se utilizan al crear una página web incluyen metatítulo y meta descripción. El metatítulo explica brevemente el tema de la página para ayudar a los lectores a comprender qué obtendrán de la página si la abren. La meta descripción es más información, aunque breve, sobre el contenido de la página.

Ambas piezas de metadatos se muestran en los motores de búsqueda para que los lectores tengan una idea rápida de lo que trata la página. El motor de búsqueda utiliza esta información para agrupar elementos similares, de modo que cuando busque una palabra clave específica o un grupo de palabras clave, los resultados sean relevantes para su búsqueda.

Los metadatos de una página web también pueden incluir el idioma en el que se escribió la página, como si es una página HTML.

Metadatos para seguimiento

Los minoristas y los sitios de compras en línea utilizan metadatos para rastrear los hábitos y movimientos de los consumidores. Los especialistas en marketing digital siguen cada uno de tus clics y compras, almacenando información sobre ti, como el tipo de dispositivo que usas, tu ubicación, la hora del día y cualquier otro dato que puedan recopilar legalmente.

Con estos metadatos crean una imagen de tu rutina e interacciones diarias, tus preferencias, tus asociaciones y tus hábitos, y pueden usar esa imagen para comercializar sus productos.

Los proveedores de servicios de Internet, los gobiernos y cualquier otra persona con acceso a grandes colecciones de información de metadatos podrían utilizar los metadatos de páginas web, correos electrónicos y otros lugares donde hay usuarios en línea para monitorizar la actividad web.

Dado que los metadatos son una breve representación de los datos más grandes, esta información se puede buscar y filtrar para encontrar información sobre millones de usuarios a la vez y rastrear cosas como incitación al odio, amenazas, etc. Se sabe que algunos gobiernos recopilan estos datos , incluidos no solo el tráfico web, sino también las llamadas telefónicas, la información de ubicación y más.

Metadatos en archivos de computadora

Cada archivo que guardas en tu computadora incluye información básica sobre el archivo para que el sistema operativo entienda cómo manejarlo, y para que tu u otra persona pueda recopilar rápidamente de los metadatos cuál es el archivo.

Por ejemplo, en Windows, cuando ve las propiedades de un archivo, puede ver claramente el nombre del archivo, el tipo de archivo, dónde está almacenado, cuándo fue creado y modificado por última vez, cuánto espacio ocupa en el disco duro, quién es el propietario del archivo y más.

La información puede ser utilizada por el sistema operativo así como por otros programas. Por ejemplo, puedes usar una utilidad de búsqueda de archivos para encontrar rápidamente todos los archivos en tu computadora que se crearon en algún momento de hoy y que pesen más de 3 MB.

Metadatos en las redes sociales

Cada vez que haces amigo de alguien en Facebook, escuchas la música que Spotify recomienda para ti, publicas un estado o compartes el tweet de alguien, los metadatos funcionan en segundo plano.

Los metadatos online son útiles en situaciones de redes sociales muy específicas, como cuando estás buscando a alguien en Facebook. Puedes ver una imagen de perfil y una breve descripción del usuario de Facebook para aprender solo los conceptos básicos sobre él antes de decidirte a hacerle amigo o enviarle un mensaje.

Gestión de bases de datos y metadatos

Los metadatos en el mundo de la gestión de bases de datos pueden abordar el tamaño y el formato u otras características de un elemento de datos. Es fundamental interpretar el contenido de los datos de la base de datos. El lenguaje de marcado extensible (XML) es un lenguaje de marcado que define los objetos de datos utilizando un formato de metadatos.

Por ejemplo, si tienes un conjunto de datos con fechas y nombres distribuidos por todas partes, no puedes saber qué representan los datos o qué describen las columnas y filas. Con metadatos básicos como nombres de columnas, puedes echar un vistazo rápidamente a la base de datos y comprender qué está describiendo un conjunto particular de datos.

Si hay una lista de nombres sin metadatos para describirlos, podría ser cualquier cosa, pero cuando agregas metadatos en la parte superior que dice “Ex Empleado”, ahora sabes que esos nombres representan a todos los empleados que han sido despedidos. La fecha junto a ellos también puede entenderse como algo útil como “Fecha de terminación” o “Fecha de contratación”.

Herramientas para encontrar metadatos

Aquí tienes varias herramientas que puedes utilizar para encontrar metadatos.

FOCA

FOCA es una herramienta que se utiliza principalmente para encontrar metadatos e información oculta en los documentos. Estos documentos pueden estar en páginas web y pueden descargarse y analizarse con FOCA.

Es capaz de analizar una amplia variedad de documentos, siendo los más comunes los archivos de Microsoft Office, Open Office o PDF, aunque también analiza archivos de Adobe InDesign o SVG, por ejemplo.

Estos documentos se buscan mediante tres posibles motores de búsqueda: Google, Bing y DuckDuckGo. La suma de los resultados de los tres motores equivale a muchos documentos. También es posible agregar archivos locales para extraer la información EXIF ​​de los archivos gráficos, y se realiza un análisis completo de la información descubierta a través de la URL incluso antes de descargar el archivo.

Octopai

Octopai es una solución de automatización de gestión de metadatos multiplataforma centralizada que permite a los equipos de datos y análisis descubrir y controlar los metadatos compartidos.

El producto realiza un escaneo de metadatos al recopilarlos automáticamente de ETL, bases de datos y herramientas de informes. Los metadatos se almacenan y administran en un repositorio central, y un motor inteligente que utiliza cientos de rastreadores busca todos los metadatos y presenta los resultados rápidamente.

Octopai se utiliza mejor para casos de uso en inteligencia empresarial, gobernanza y catalogación de datos.

Infogix

Infogix ofrece un conjunto de capacidades integradas de gobernanza de datos que incluyen glosarios comerciales, catalogación de datos, linaje de datos y gestión de metadatos.

La herramienta también proporciona cuadros de mando personalizables y flujos de trabajo de código cero que se adaptan a medida que madura cada capacidad de datos de la organización. Los clientes de referencia utilizan Infogix para la gobernanza de datos y para la gestión de riesgo, cumplimiento y valor de datos.

El producto también es flexible y fácil de usar, y también admite trabajos de análisis de datos más pequeños.

Collibra

El diccionario de datos de Collibra documenta los metadatos técnicos de una organización y cómo se utilizan. Describe la estructura de un dato, su relación con otros datos y su origen, formato y uso.

La solución sirve como un repositorio de búsqueda para los usuarios que necesitan comprender cómo y dónde se almacenan los datos y cómo se pueden utilizar. Los usuarios también pueden documentar roles y responsabilidades y utilizar flujos de trabajo para definir y mapear datos. Collibra es único porque el producto se creó pensando en los usuarios finales empresariales.

Alex Solutions

Es un catálogo de datos empresariales unificados agnósticos en tecnología. Cuenta con un glosario empresarial que permite a los usuarios definir y mantener términos comerciales clave y vincularlos a activos, procesos y resultados de datos físicos.

La calidad de los datos basada en políticas combina el linaje de los datos con la creación de perfiles de datos y el etiquetado inteligente basado en el aprendizaje automático. Alex también ofrece etiquetado inteligente que ayuda a los usuarios a agregar contexto comercial a los activos de datos físicos. La implementación y la integración son simples y la interfaz de usuario del producto es amigable para los usuarios comerciales.

IBM InfoSphere Metadata Workbench

Los analistas de datos y empresas utilizan Infosphere Metadata Workbench de IBM para explorar y analizar las relaciones entre los activos de información y el repositorio de metadatos. Su eficiencia proviene de su capacidad para proporcionar análisis de impacto con una visión general de los efectos que producen los cambios en los entornos de gestión de la información.