Logotipo de Zephyrnet

Creación de un programa de calidad de datos exitoso: DATAVERSITY

Fecha:

Crear un programa de calidad de datos exitoso es esencial para cualquier organización que busque utilizar sus datos para mejorar la eficiencia y la toma de decisiones. Los datos de mala calidad pueden dar lugar a decisiones que perjudiquen al negocio. Crear un programa de calidad de datos exitoso ayuda a garantizar que los datos sean de la más alta calidad, haciéndolos útiles y rentables. Si no se puede confiar en los datos, tampoco se puede confiar en las decisiones tomadas al utilizarlos.

El impacto de la baja o mala calidad de datos puede resultar en daños significativos a una empresa. Un programa eficaz de calidad de datos ayuda a garantizar que los datos de la organización sean precisos y útiles. Desarrollar un programa exitoso requiere que el administrador de datos evalúe el nivel actual de calidad de los datos de la empresa, implemente estrategias funcionales y desarrolle un sistema de mejores prácticas. Los administradores de datos son necesarios para la gestión y organización del programa de calidad de datos de una empresa.

In su articulo La calidad de los datos es asunto de todos: gestionar la calidad de la información, Tom Breur, vicepresidente de análisis avanzado de Health Advances, hizo esta observación: 

“Con los administradores de datos implementados y el control de calidad respaldado por un cuadro de mando de calidad de datos, observamos un fenómeno interesante. Sin medidas adicionales, simplemente llamando la atención sobre la importancia de la calidad de los datos y retroalimentación constante sobre las tasas de error, la precisión siguió aumentando a niveles que antes se consideraban imposibles”.

una muestra de un Cuadro de mando de calidad de datos que se pueda adaptar a los fines de la organización es ofrecido por ABX MEDIA.

El error humano desempeña un papel importante a la hora de distorsionar los datos y producir datos de mala calidad. Sin embargo, la implementación y el uso de servicios de software automatizados pueden reducir estos errores significativamente. Siempre que sea posible, se deben implementar servicios automatizados. Una de las mayores preocupaciones sobre la calidad de los datos en cualquier empresa es el error humano.

Según la  Alexander Wurm, analista senior de Nucleus Research, 

“Se tiende a ver el mayor riesgo en cualquier lugar donde haya puntos de contacto humano. Es por eso que automatizar procesos como la incorporación y la baja puede tener valor tanto para mejorar la seguridad de los datos como para obtener nuevas eficiencias en los procesos o ahorros de tiempo”.

La importancia del administrador de datos en un programa de calidad de datos

El administrador de datos es responsable de la calidad de los datos: su precisión, coherencia y formato. El administrador de datos también es responsable de gestionar las políticas de gobernanza de datos, monitorear el cumplimiento y abordar los desafíos relacionados con los datos.

Cada vez más, los propietarios y gerentes de empresas se dan cuenta de la necesidad de administración de datos, particularmente a medida que su negocio se expande. Las responsabilidades adicionales de un administrador de datos pueden incluir, entre otras:

  • Almacenamiento de datos
  • Garantizar que los nuevos datos no se superpongan con ningún dato existente y contradictorio.
  • Garantizar que los datos estén libres de errores
  • Buscando posibles errores en la estructura de datos.
  • Aprobar la coherencia de los datos.

Al monitorear los datos (o realizar un seguimiento del software que los monitorea), un administrador de datos puede identificar y abordar problemas relacionados con los datos, mantener estándares adecuados de privacidad y seguridad y promover la toma de decisiones basada en datos.

La carga de trabajo de los administradores de datos varía según el tamaño de la organización y sus necesidades de gestión de datos. Una organización pequeña, con necesidades mínimas de gestión de datos, podría asignar y capacitar a un miembro actual del personal para que sea el administrador de datos a tiempo parcial. En una organización más grande, es posible que se necesiten algunos administradores de datos para manejar datos técnicos, datos de seguridad, etc. Además, una organización grande y compleja podría decidir agregar un “administrador” de administradores de datos para supervisar múltiples administradores de datos (y posiblemente los administradores de datos). administrador del oleoducto).

Es importante que el administrador de datos tenga una sólida comprensión de las metas y objetivos generales de la empresa.

La filosofía de "¡Si no está roto, no lo arregles!" no debe aplicarse a las empresas modernas basadas en datos. Las empresas modernas están en constante evolución, con el objetivo de vencer a la competencia. Como consecuencia, los administradores de datos deben programar revisiones periódicas de sus prácticas y herramientas para garantizar que los estándares de calidad de datos sigan evolucionando.

Los datos tienen valor, siempre que sean precisos y coherentes. 

Las características clave de la calidad de los datos

Al evaluar la calidad de los datos, medir su precisión, integridad y coherencia (la dirección de un cliente es la misma tanto en facturación como en ventas), el administrador de datos puede ayudar a garantizar datos bastante confiables. 

Los datos de alta calidad proporcionan información confiable y procesable. Proporcionar una buena calidad de datos requiere identificar y corregir errores, eliminar duplicados (preferiblemente confiando en datos maestros) y formatear correctamente los datos.

La evaluación de la calidad de los datos a menudo incluye el establecimiento de un estándar de Calidad de datos aceptable, utilizando técnicas de análisis y elaboración de perfiles de datos, y utilizando métodos estadísticos para identificar y corregir cualquier problema de calidad de los datos. Las características clave (a menudo llamadas “dimensiones”) que deben examinarse y medirse son:

  • Lo completo: No deben faltar datos ni tener valores incompletos. (Se puede utilizar una evaluación de integridad para garantizar que no falte información vital).
  • Unicidad: Ubique y elimine copias para garantizar que la información en los archivos de datos de la organización esté libre de duplicaciones.
  • Validez: Esto se refiere a qué tan útiles son los datos y qué tan bien se ajustan a los estándares de la organización. (Almacenar datos inútiles es un desperdicio de recursos y puede confundir y dañar la investigación).
  • Oportunidad: Es necesario eliminar la información antigua que a menudo ya no es verdadera o precisa. Los datos se pueden medir utilizando su relevancia y actualidad. Los datos desactualizados deben eliminarse para no causar confusión.
  • Precisión: Esta es la precisión de los datos y la precisión con la que representan la información del mundo real.
  • Consistencia: Cuando se copian datos, la información debe ser coherente y precisa. La necesidad de una fuente única de datos internos precisos proporciona un buen argumento para el uso de datos maestros y sus mejores practicas. (Una evaluación de coherencia garantiza que no haya contradicciones ni conflictos informativos).

Uso del linaje de datos y la catalogación de datos para mejorar la calidad de los datos

El uso del linaje de datos y la catalogación de datos para mejorar la calidad de los datos son innovaciones bastante recientes. Cada vez más, las organizaciones reconocen la importancia de utilizar la catalogación y el linaje de datos para mejorar y mantener la calidad de los datos. 

Catálogos de datos se puede utilizar para proporcionar un historial que se remonta a la fuente, y los administradores de datos pueden utilizar el linaje de datos para monitorear y mantener la calidad de los datos.

El proceso de evaluación

Evaluar la calidad de los datos de la organización ayuda a identificar brechas, mejorar la gobernanza de los datos y tomar decisiones basadas en datos confiables y de alta calidad. En términos generales, realizar una evaluación “manual” de la calidad de los datos requiere tanto esfuerzo que la mayoría de los gerentes nunca la aprobarían. 

El proceso de evaluación incluye varios pasos:

  • Revisar los objetivos comerciales generales de la organización es siempre un buen primer paso antes de planificar y realizar mejoras organizativas.
  • El segundo paso implica identificar áreas específicas donde las mejoras en la calidad de los datos promoverán el éxito del negocio. Considere qué características clave (precisión, integridad, validez, coherencia, singularidad y puntualidad) deben mejorarse para tener el mayor impacto en los procesos y la toma de decisiones del negocio.
  • Desarrollar un sistema de medición. Por ejemplo, al evaluar la característica de unicidad, se puede localizar y contar el número de archivos que tienen el mismo título. (Tengo varios currículums “antiguos” y el actual actualizado, todos con el mismo título, almacenados en varios lugares de mi computadora portátil. Ocupan algo de espacio de almacenamiento, pero lo más importante es que a menudo causan un poco de confusión antes de enviar el currículum actualizado uno a un cliente potencial. Esto se considera una gestión deficiente de la calidad de los datos.) Al examinar entre 20 y 50 títulos de archivos diferentes en busca de copias, se puede realizar una estimación estadística de la unicidad. Si el 50% de los títulos tiene varias copias, la unicidad debería ser una preocupación. Si sólo dos de los títulos tienen una única copia, estadísticamente hablando, la unicidad no debería ser una alta prioridad.
  • Evalúe los datos utilizando funciones clave para identificar problemas de calidad de datos. 
  • Después de examinar los datos, el administrador de datos puede comenzar el proceso de eliminar datos innecesarios o inexactos (limpieza de datos), y establecer procedimientos, basados ​​en las mejores prácticas, que promuevan el almacenamiento y uso de datos de alta calidad. 

Mejores prácticas para un programa de calidad de datos exitoso

Históricamente, el desarrollo de la calidad de los datos se ha tratado como una cuestión de mantenimiento y reparación: un proceso de detección de problemas una vez que los datos ya se han almacenado en las bases de datos de la organización. Sin embargo, se puede diseñar un programa de calidad de datos para abordar las inquietudes sobre los datos de manera proactiva a medida que los datos se mueven por la organización. 

A continuación se enumeran algunas de las mejores prácticas para mantener la calidad de los datos: 

  • Examine y evalúe las fuentes de datos externas comúnmente utilizadas por la organización en busca de limitaciones o problemas de formato.
  • Mantener un enfoque en la estrategia de negocio. 
  • Reconocer que aplicar la Calidad de Datos es una práctica que no tiene fecha de finalización.
  • Utilice la automatización siempre que sea posible para minimizar los errores humanos y completar las tareas laborales.
  • Desarrollar un vocabulario estandarizado de procesamiento de datos para una buena comunicación.
  • El administrador de datos debe identificar y establecer responsabilidades para el resto del personal en el mantenimiento de la calidad de los datos.
  • El administrador de datos debe educar y actualizar al personal y a la gerencia.
  • Proporcione actualizaciones (informes semanales, luego pase a informes mensuales).
  • Implementar un programa de limpieza de datos programado periódicamente (software puede ser usado).
  • Implementar evaluaciones periódicas de la calidad de los datos (quizás cada seis meses).

Imagen utilizada bajo licencia de Shutterstock

punto_img

Información más reciente

punto_img