Logotipo de Zephyrnet

Mejores prácticas de gestión de metadatos – DATAVERSITY

Fecha:

El uso de las mejores prácticas de gestión de metadatos ayuda a maximizar el valor de los datos almacenados por una organización. Encontrar los datos correctos una vez almacenados puede resultar difícil si el sistema de almacenamiento no tiene organización. Los metadatos se utilizan para organizar los datos de modo que se puedan encontrar fácilmente. 

Los metadatos son esencialmente un sistema de etiquetado, similar a los catálogos de tarjetas utilizados por muchos usuarios de la biblioteca cuando buscan libros específicos en los estantes de la biblioteca. Se ha utilizado alguna forma de metadatos para localizar información Durante miles de años.

Las mejores prácticas de gestión de metadatos implican establecer un sistema para manejar los metadatos de una organización específica de una manera útil y organizada.   

Los metadatos utilizan descripciones y palabras clave asociadas con el contenido de un archivo, lo que permite que un motor de búsqueda lo encuentre fácilmente. Los metadatos de un archivo generalmente se basan en información que describe o se relaciona con el archivo, utilizando características como su nombre, fecha, autor, tipo y ubicación. Estas funciones se utilizan para filtrar y organizar los archivos.

Al desarrollar un sistema organizado para gestionar metadatos y utilizar el software adecuado, una empresa puede garantizar que su información pueda localizarse.

Desafortunadamente, no hay muchas herramientas o plataformas disponibles que proporcionen una gestión real de la estructura de metadatos. El software que se describe como destinado a la gestión de metadatos es a menudo una plataforma que utiliza un motor de búsqueda de metadatos y proporciona una variedad de servicios (como linaje de datos, definiciones semánticas y análisis de impacto) pero muy pocos en la gestión real de la estructura de los metadatos. 

Cuando una empresa utiliza un sistema claro y bien organizado para gestionar sus metadatos, los datos necesarios para tomar decisiones comerciales (inteligencia empresarial ) se pueden localizar rápida y fácilmente. Los metadatos se pueden generar automáticamente cada vez que se crean, modifican o actualizan datos, pero también se pueden crear o modificar manualmente. Sin embargo, la selección de metadatos que se utilice debe ser específica de las necesidades de la organización. Seleccionar los metadatos adecuados para las necesidades específicas de una organización es una buena práctica. 

Sin una estrategia para organizar y gestionar los metadatos y proporcionar información precisa, las posibilidades de tomar malas decisiones aumentan. La estrategia de cada organización para gestionar metadatos será única. El sistema de metadatos/etiquetado utilizado depende del tipo de negocio, así como de sus objetivos y prioridades.

Las mejores prácticas de gestión de metadatos sugieren que una empresa debería utilizar una estructura de metadatos diseñada para maximizar el valor de sus datos. 

Metadatos como sistema de soporte

Un sistema de gestión de metadatos bien diseñado también admite Gobierno de datoscatálogos de datosy EN LINEA. Los metadatos se pueden utilizar para respaldar los esfuerzos de un programa de gobernanza de datos para garantizar datos de alta calidad proporcionando la fuente, la fecha, su historial y el número de copias. 

También se puede utilizar para respaldar la creación, actualización y mantenimiento de un catálogo de datos (inventarios organizados de los activos de datos de una organización). Los metadatos también se pueden utilizar en la seguridad de los datos, para proteger datos confidenciales y evitar que usuarios no autorizados accedan a los datos y los modifiquen.

Además, los metadatos ayudan a proporcionar contexto para que los humanos los utilicen durante la investigación. Por ejemplo, los metadatos pueden contener el título, una descripción, la fecha de presentación, etc.

Ejemplos de metadatos

Los metadatos de mi computadora portátil Mac OS (una especie de ventana emergente a la que se accede a través de "obtener información") proporcionan un título en la parte superior (por ejemplo, "Imágenes JPG" o "novela de robot") seguido del "tipo" de documento (JPEG, documento de texto enriquecido, PDF, etc.). Esta información va seguida de otros términos de referencia, como tamaño, donde (la ubicación del archivo), creado (la fecha), y modificado (la fecha). 

Cerca del centro de la ventana emergente de metadatos se encuentran los términos de referencia. más información, nombre y extensión, comentariosy abierto con (el formato del archivo: RTF, PDF, JPEG). La parte inferior de la ventana emergente de metadatos contiene una vista previa del archivo y compartir y permisos (seguridad, acceso administrativo). 

Como resultado, puedo encontrar archivos buscando por título, fecha de creación, fecha de última modificación o por ubicación. El resto de la información puede ser útil para la identificación y la investigación.

El  Iniciativa de metadatos Dublin Core ha desarrollado una lista de términos de referencia estandarizados básicos y útiles (a menudo denominados "elementos") que se pueden utilizar para crear un formato de metadatos. Se presentan a continuación. Sin embargo, al desarrollar un formato de metadatos, no hay razón para limitarse a sus términos. Al desarrollar su propio marco de metadatos, siéntase libre de desarrollar sus propios términos de referencia personalizados.

  • Contribuyente
  • Cobertura
  • Creador
  • Fecha
  • Descripción
  • Formato
  • Identificador
  • Idioma
  • Publisher
  • Relación
  • Derechos
  • Fuente
  • Tema 
  • Título
  • Tipo de Propiedad

Mejores prácticas para desarrollar un programa de gestión de metadatos

En teoría, el administrador de Gobernanza de Datos o el equipo de Gobernanza de Datos será responsable de desarrollar e implementar un programa de gestión de metadatos. Si la organización es lo suficientemente grande y/o está lo suficientemente ocupada, es posible que sea necesario crear un puesto de administrador de metadatos.

La gestión de metadatos es útil en maximizando el valor de los datos de una organización. Implementar un programa de gestión de metadatos puede aportar numerosos beneficios a una organización. Promueve el descubrimiento y la comprensión de los activos de datos de la organización, lo que a su vez respalda un trabajo más productivo y eficiente. 

Las mejores prácticas para desarrollar (o reestructurar) un programa de gestión de metadatos se enumeran a continuación:

1. Revisar los objetivos de la organización para mayor claridad es un buen primer paso. Las ganancias están respaldadas, en parte, por la inteligencia empresarial y la eficiencia. La inteligencia empresarial y la eficiencia están respaldadas, en parte, por un programa de gestión de metadatos bien diseñado. 

2. Establecer los objetivos específicos del programa de metadatos. ¿Qué tipo de negocio tienes? Las necesidades de información de un hospital son diferentes de las necesidades de una empresa manufacturera. En la fabricación, podría resultar útil poder acceder a datos sobre defectos en una línea de montaje, junto con sus horas, fechas y nombres de empleados. ¿Qué tipo de trabajo realiza su organización? 

3. Encuentre formas de modificar o editar los “elementos” de metadatos. La selección de términos/elementos de referencia de metadatos útiles y fáciles de entender puede mejorar la eficiencia general. El software de metadatos automatizados normalmente está integrado en los sistemas operativos de las computadoras (Mac, Linux, Windows) para almacenar archivos en discos duros de manera organizada. Esto dificulta la edición de los elementos de metadatos, pero hay algunas tácticas disponibles.

CollectiveAccess (desarrollado por Providence) es un software de código abierto que puede proporcionar un sistema de gestión de metadatos alternativo y editable, y funciona bien con sistemas Linux, Microsoft y Mac OS X 10.9+, pero también requiere el soporte de la plataforma MySQL. 

Microsoft Word no permite eliminar o modificar sus “propiedades de documento” (elementos) estándar, pero sí permite para la adición de nuevos elementos/propiedades de documentos, que pueden usarse para cumplir el mismo propósito.

4. Seleccionar los mejores términos/elementos de referencia. Determinar qué términos de referencia se utilizan es importante para desarrollar un programa de metadatos eficiente. Por ejemplo, las empresas minoristas se beneficiarían al analizar los metadatos relacionados con sus ventas y los comentarios de los clientes, como una forma de identificar tendencias y tomar decisiones sobre qué productos se compran. Al utilizar los términos de metadatos relevantes, como tipo de “producto” (camisa, vestido), la “fecha de venta”, la “talla”, el “color” y la “marca”, los metadatos se pueden utilizar para investigar y mejorar las ventas online del negocio.

Además, el uso de “las palabras claves”Dentro de los metadatos permite a los compradores localizar lo que buscan de manera más eficiente.

Por otro lado, un hospital seleccionaría términos de metadatos centrados en los pacientes y su tratamiento. Estos metadatos contendrían el "nombre" del paciente, tal vez su "médico", la fecha de su "última visita", cualquier "medicamento" que esté tomando y "problemas de salud".

5. Actualizar al personal sobre los cambios. Se debe notificar al personal, y tal vez capacitarlo, sobre cualquier cambio en la estructura de los metadatos o sobre cómo los utiliza el personal. Cualquier lista de mejores prácticas no está completa si el personal no sabe acerca de los cambios.

Mejores prácticas para el mantenimiento de la gestión de metadatos

Lamentablemente, la gestión de metadatos no es una actividad única. Debe mantenerse, ajustarse y mejorarse a medida que la organización crece y evoluciona. Los metadatos se utilizan para respaldar la gobernanza de datos, y muchas de las habilidades utilizadas para mantener el programa de gobernanza de datos son similares a las habilidades necesarias para mantener y respaldar la gestión de metadatos.

Se debe asignar a alguien (preferiblemente el administrador o equipo de Gobernanza de datos) la responsabilidad de actualizar al personal sobre cualquier cambio en el sistema de metadatos, mantener el sistema y editar y modificar el sistema de metadatos, según sea necesario. Esta persona (y quizás dos o tres copias de seguridad, en caso de que algo le suceda) deben ser las únicas con acceso al “sistema” de metadatos para evitar actos maliciosos.

Realizar auditorías periódicas para determinar la precisión y funcionalidad de sus metadatos puede ayudar a evaluar e identificar áreas que necesitan mejoras. Las preocupaciones más obvias sobre el mantenimiento de metadatos son:

  • Devengo: Garantizar que se adjunten metadatos precisos a todos los registros nuevos
  • Supresión: La eliminación de registros innecesarios y sus metadatos. 
  • Modificación: Modificar los metadatos según sea necesario para garantizar su precisión.
  • compartir: Copiar y compartir datos seleccionados necesarios para otros usos
  • Migración: Transferir datos de un sistema de arquitectura a otro.
  • Visibilidad: Poner a disposición datos para la investigación
  • Seguridad: Restringir el acceso a los controles de metadatos a personas seleccionadas

El futuro de la gestión de metadatos

Durante una Entrevista DATAVERSITY® sobre el futuro de la gestión de metadatos, Emily Washington, vicepresidenta senior de gestión de productos de Precisely, dijo: 

“La información de metadatos debe actualizarse a medida que se agregan nuevos campos a los sistemas o nuevas entradas y salidas fluyen hacia y desde ellos. Mucha automatización ayuda a administrar los metadatos, manteniéndolos actualizados, de modo que se puedan verificar los cambios, adiciones y eliminaciones. El aprendizaje automático y la inteligencia artificial pueden monitorear las tendencias y el uso históricos de los metadatos. Puede determinar, a partir de los metadatos, qué datos se han tocado con más frecuencia, dónde reside la información confidencial y dónde existen datos redundantes”.

Imagen utilizada bajo licencia de Shutterstock

punto_img

Información más reciente

punto_img