Logotipo de Zephyrnet

Crear e implementar una estrategia de metadatos

Fecha:

Desarrollar una estrategia de metadatos es necesario para que un negocio en crecimiento mantenga y mejore la eficiencia. Los metadatos son una pequeña cantidad de datos que se utilizan para identificar una colección más grande de datos (imágenes, texto, archivos, objetos digitales). Se genera cada vez que se recopilan datos de su fuente, se mueven a través de un sistema de datos, los usuarios acceden a ellos, se integran con otros datos, se limpian o analizan. 

Cualquier forma o cantidad de datos se puede etiquetar con metadatos, automáticamente (o manualmente). Las etiquetas de metadatos suelen estar diseñadas para facilitar la búsqueda de los datos deseados. 

¿QUIERES MEJORAR LA CALIDAD DE LOS DATOS DE TU ORGANIZACIÓN?

Aprenda cómo comenzar y aproveche una multitud de principios y prácticas de calidad de datos con nuestros cursos en línea.

La información (descriptores o palabras clave) que transmiten las etiquetas de metadatos generalmente se asocia con elementos relevantes, como el título, las fechas, los creadores o la información técnica. Las etiquetas no se presentan al usuario, sino que se ocultan dentro del código fuente. Transmiten el contenido de los metadatos a navegadores, motores de búsqueda y otras herramientas. Los metadatos también pueden comunicar cómo se han utilizado los datos. Hay seis Tipos basicos de metadatos:

  • Metadatos descriptivos: Este tipo de metadatos se utiliza para el descubrimiento y la identificación. Incluye descriptores como el título, el autor y las palabras clave.
  • Metadatos estructurales: Contiene descriptores sobre contenedores de datos. Describe la versión, las relaciones y otras características de los materiales digitales.
  • Metadatos administrativos: Presenta información para administrar un recurso, como el tipo de recurso, los permisos y cómo y cuándo se crearon los datos.
  • Metadatos de referencia: Esta forma de metadatos trata sobre el contenido y la calidad de los datos estadísticos.
  • Metadatos estadísticos: Puede usarse para describir los procesos involucrados en la recopilación, el procesamiento o la producción de datos estadísticos.
  • Metadatos legales: Proporciona información sobre el creador, el titular de los derechos de autor y las licencias públicas.

El propósito de los metadatos es proporcionar una forma de indexar, preservar, acceder y descubrir recursos digitales.

Algunas organizaciones nunca han organizado o desarrollado realmente sus arquitectura de datos, y a medida que han crecido, sus datos se han dispersado y desorganizado. Esto puede dificultar la búsqueda de los datos deseados. Para que las empresas tengan éxito en este mundo moderno, deben poder ubicar y utilizar sus datos de manera rápida y eficiente.

Gobierno de datos y metadatos

Los metadatos están diseñados para funcionar con el software de Data Governance y son una característica crítica de Data Governance, que permite indexar y acceder a los conjuntos de datos. Una estrategia de metadatos debe incluir la integración de los metadatos con el Programa de gobernanza de datos. Esto protegerá los datos sensibles o confidenciales antes de infringir las normas o leyes de privacidad existentes (como la RGPD, CCPA o LGPD). Data Governance brinda responsabilidad por los activos de datos y se asegura de que los metadatos sean siempre precisos y consistentes. Tradicionalmente, la gestión de metadatos se ha utilizado para organizar y clasificar datos por motivos de cumplimiento. 

Actualmente, las instrucciones de aprendizaje automático que están integradas en los programas de gobierno de datos automatizan el proceso de captura y selección de metadatos.

Marco de gobernanza de datos a menudo incluye el uso de varias aplicaciones y programas de software, como el almacenamiento de datos, la calidad de los datos, la gestión de datos maestros y la gestión de metadatos. Los programas de gobierno de datos se pueden utilizar para respaldar la transparencia total sobre el flujo de datos de la empresa, lo que permite definir, rastrear, medir y administrar los activos de datos.

Desarrollo e implementación

Una comprensión profunda de los metadatos de la organización es fundamental para implementar de manera efectiva una estrategia de metadatos. Hay una serie de pasos involucrados en el desarrollo de un sistema de metadatos. Es especialmente importante programar el tiempo necesario para organizar, implementar y probar el sistema (repetidamente) hasta que se cumplan todos los requisitos. El plan de implementación debe incluir el cronograma y todos los detalles del proyecto.

El plan de implementación debe dividir el proceso en tareas discretas y manejables. Por ejemplo, desarrollar un mapa de todos los activos de datos activos involucrará cualquier lago de datos, almacenes de datos, bases de datos, almacenamiento en la nube, correos electrónicos y otro almacenamiento utilizado por la empresa. Cada sitio de almacenamiento debe enumerarse y programarse para la investigación individualmente. (Seguimiento de los metadatos en un datos, con sus datos no indexados, puede requerir dividirlo en tareas manejables).

La implementación de una estrategia de metadatos normalmente incluye los siguientes pasos y subpasos:

Desarrolle una plantilla de metadatos: En este punto, el objetivo es determinar qué tipos de metadatos deben usarse para maximizar su capacidad de descubrimiento. Esto requiere recopilar información de las personas que utilizan los datos sobre cómo diseñar mejor la plantilla. Durante esta fase de recopilación de información, se puede entrevistar al personal, se puede encuestar a los clientes y se pueden organizar talleres para obtener información de TI y de las partes interesadas. Asegúrese de evaluar cómo los clientes y usuarios comerciales etiquetan sus propios metadatos e identifican elementos comunes. 

  • Identificar los tipos de metadatos que se utilizarán: Aquí, el objetivo es determinar los tipos de metadatos que comunicarse mejor el contenido y las necesidades del negocio (descriptivo, estructural, administrativo, referencial, estadístico, legal). Decida qué tipos de metadatos describen mejor los activos de datos de la organización, incluidos números enteros, texto libre, cadenas, la fecha o los campos de fecha/hora. Luego determina si se necesitan reglas (por ejemplo, es posible que los campos de título deban limitarse a 50 caracteres, o que los campos de fecha/hora deban usar estándares de visualización internacionales).
  • Establecer un vocabulario de metadatos: Se debe desarrollar una definición formal de descriptores para comunicaciones consistentes de los metadatos. Por lo general, los vocabularios de metadatos se basan en datos específicos del dominio. Los elementos de metadatos a menudo se agrupan en categorías, por ejemplo, datos de clientes, datos de productos e imágenes. Desarrollar un glosario de metadatos para respaldar el vocabulario y puede ayudar con las comunicaciones y también debe ser parte de la estrategia de Gobierno de datos, que enfatiza Calidad de los Datos.
  • Ojo con los metadatos del asunto: Curiosamente, los metadatos contienen… sub-metadatos. Las estructuras de metadatos de los metadatos a menudo tienen sus propios metadatos. Puede ser un nombre descriptivo o la longitud de los caracteres. Metadatos del asunto es el nombre correcto para este tipo de metadatos. Los descriptores de los metadatos del tema se pueden utilizar para vincular los registros de los socios e instituciones contribuyentes con otros registros, lo que facilita su búsqueda.

Asigne los metadatos: Cree algún tipo de gráfico rastreable. Podría ser una hoja de cálculo o una tabla en una computadora. Las pizarras blancas son una opción, aunque se deben tomar medidas para evitar que se borre accidentalmente. Con la información recopilada en los pasos anteriores, mapee los metadatos indicando dónde y cómo se usan. 

  • Después de enumerar los metadatos y sus ubicaciones, busque descriptores comunes. (A veces, los descriptores tienen nombres diferentes pero tienen el mismo propósito. Para fines de investigación, calificarían como descriptores comunes). Recuerde que es importante poder rastrear los datos hasta su fuente original (como un sistema ERP o CRM).
  • Créar un catálogo de datos. Un catálogo de datos es un inventario organizado de activos de datos para una empresa. Este catálogo debe mantenerse y actualizarse de forma programada.

Evaluación: En esta etapa, el objetivo es determinar si existen "herramientas" de importación/exportación, sincronización o administración de datos maestros necesarias para mantener los metadatos consistentes y limpios en toda la empresa. La siguiente información será útil para determinar cómo diseñar los metadatos y los tipos de herramientas de gestión de metadatos a la investigación para apoyar la estrategia de metadatos. 

Comprender a las personas y los procesos: esta es una parte importante de la fase de evaluación, que implica comprender cómo funcionan los procesos, los problemas que tienen las personas y sus soluciones. A continuación se enumeran algunas formas de obtener una mejor comprensión de las personas y los procesos:

  • Realice un seguimiento de cómo se mueven los datos a través de la empresa. Busque descriptores comunes a medida que los datos se mueven dentro del sistema.
  • Comprender cómo se utilizan los metadatos. ¿Se utiliza para completar formularios o para conectarse con otros sistemas? ¿Iniciará procesos de flujo de trabajo?
  • Determine cómo se organizarán los descriptores. ¿Permitirá el proceso de captura de metadatos el uso de un método de estilo libre para etiquetar el contenido (llamado "folksonomía”) o estará completamente automatizado?
  • ¿Qué capacitación o educación necesitará el personal para adaptarse sin problemas a los cambios? ¿Cómo se llevará a cabo la capacitación?

Diseñar el modelo de metadatos para mejoras continuas: La retroalimentación es importante para la mejora continua y la evolución del modelo de metadatos. Es crucial recopilar comentarios de su personal y clientes para garantizar que el plan de metadatos continúe respaldando los objetivos comerciales. 

Aquí hay algunas recomendaciones para incorporar la mejora continua en su diseño:

  • Comuníquese con los administradores a intervalos regulares para acceder a la funcionalidad del modelo de metadatos. 
  • A medida que cambian los objetivos comerciales, es posible que el modelo de metadatos también deba cambiar.
  • Proporcione un mecanismo de retroalimentación para cualquiera que tenga una sugerencia o queja sobre los metadatos.

Automatice siempre que sea posible: Hay tres razones básicas para la automatización. Es mucho, mucho más rápido; elimina el error humano; y "automáticamente" se asegura de que la tarea se lleve a cabo. La automatización de los metadatos puede reducir significativamente el tiempo dedicado a tareas como el etiquetado y la catalogación de datos.

Los beneficios de implementar una estrategia de metadatos

Los metadatos son un factor importante para obtener el máximo valor de sus datos. Asegura la consistencia de los datos, respalda el gobierno de datos y ayuda con el cumplimiento normativo. También respalda la investigación utilizada al tomar decisiones comerciales inteligentes.

El uso de la automatización de metadatos en tiempo real puede ser extremadamente útil y rentable. El personal puede acceder a los datos más actualizados, mejorando la eficiencia y la calidad de los datos (y tomar mejores decisiones). La automatización se puede utilizar para estandarizar, clasificar y corroborar datos. Como consecuencia, todas las inconsistencias de datos, y otros problemas, se corrigen en tiempo real.

Advertencia: se debe realizar una investigación exhaustiva (y/o contratar a un consultor) antes de implementar una estrategia de metadatos. Perder tiempo y dinero en herramientas que no funcionan es contraproducente. 

Imagen utilizada bajo licencia de Shutterstock.com

punto_img

Información más reciente

punto_img