Logotipo de Zephyrnet

Calidad de datos versus enriquecimiento de datos – DATAVERSITY

Fecha:

calidad de datos versus enriquecimiento de datoscalidad de datos versus enriquecimiento de datos
PCH.Vector / Shutterstock.com

La calidad de los datos (DQ), el grado de confianza de las empresas y los consumidores en la utilidad de los datos, sigue siendo un punto de fricción para obtener información empresarial y gestionar el riesgo. Según investigaciones recientes, se necesita un promedio de 15 horas para resolver un problema o incidente de calidad de datos determinado, y en 2024 y más allá, el 25 % o más de los ingresos estarán sujetos a problemas de calidad de datos.

En respuesta a estos desafíos, más de 50% de las organizaciones planean implementar soluciones de automatización e inteligencia artificial, incluidas enriquecimiento de datos. El enriquecimiento de datos describe los procesos y actividades que aumentan los conjuntos de datos existentes para mejorar la calidad de los datos y generar conocimientos más profundos.

El enriquecimiento sigue siendo una petición popular, como lo demuestran más de 19 de cada 20 líderes en experiencia del cliente (CX) que invierten en ello o planean hacerlo. Además, las empresas encuentran que un 10% La mejora de la calidad de los clientes potenciales mediante el enriquecimiento de datos puede dar lugar a un aumento del 40 % en los ingresos por ventas. 

Sin embargo, la mejora de los datos no es una solución mágica que pueda resolver todos Problemas de calidad de datos. Para obtener realmente los beneficios de la calidad de los datos, los empresarios deben comprender las distinciones entre la calidad de los datos y el enriquecimiento de los datos, cómo se complementan entre sí y cómo enriquecer los datos como táctica de calidad de los datos. 

Comprender la calidad de los datos con coherencia

Cuando se les pide que definan la calidad de los datos, los empresarios suelen describir que tienen datos que pueden utilizar para completar y tener éxito en los objetivos laborales. Sin embargo, cada persona puede interpretar un buen DQ de manera ligeramente diferente, dependiendo de los problemas y requisitos que vea y de cuándo se plantee la pregunta. 

Parte de esta confusión puede explicarse por cómo se puede evaluar la CD. Las unidades de negocio miden datos aceptables en varias dimensiones, incluyendo precisión, integridad, coherencia, integridad, singularidad y validez. Cada equipo puede utilizar una combinación diferente de indicadores DQ para varios atributos o ponderarlos de manera diferente.

Además, lo que constituye un buen objetivo de QD puede no sincronizarse en toda la empresa, especialmente si el negocio y Estrategia de datos no están claros. No es de extrañar que una empresa pueda fácilmente tener vendedores haciendo 85% de errores embarazosos debido a datos inexactos de los clientes y registros duplicados en todos los sistemas con información contradictoria. 

Por lo tanto, es fundamental que cada empresa obtenga una comprensión coherente de la DQ, especialmente cuando cualquier fuente de datos externa probablemente tenga su definición única de DQ. Como afirma William McKnight, asesor de muchas de las organizaciones más conocidas del mundo, en su Webinar, las mejoras en DQ ocurren cuando las personas saben cómo son los datos más limpios y toman medidas para lograrlo. Esta descripción consistente de DQ es fundamental para saber si se deben reforzar los datos disponibles y cuándo hacerlo. 

Comprender el enriquecimiento de datos

El enriquecimiento de datos es una táctica de calidad de datos que abarca procesos y acciones de integración. necesario para aumentar conjuntos de datos existentes. Las corporaciones mejoran sus datos para llenar los vacíos que faltan, captar matices contextuales y agregar detalles adicionales para describir una entidad, generalmente un cliente potencial o activo. Para cualquier objetivo, las organizaciones tienen la opción de elegir qué datos reforzar.

Las empresas adoptan diferentes tipos de enriquecimiento de datos que apuntan a atributos críticos y brindan información alineada con los objetivos comerciales. Ejemplos de tipos de enriquecimiento incluyen:

Normalmente, el enriquecimiento de datos coincide con otras tácticas empresariales de calidad de datos. Durante este proceso, TI o el equipo de tecnología estandarizan los datos de terceros o el formato de datos externos antes de la integración. 

Este proceso implica extraer y transformar los datos externos para que los sistemas que los reciben puedan leerlos y comprenderlos. Como último paso de Extraer, Transformar y Cargar (ETL), la aplicación agrega los datos externos a los sistemas internos, agregando los datos actuales.

Cómo funciona el enriquecimiento de datos con la calidad de los datos

La eficacia del enriquecimiento de datos puede afectar o no la calidad de los datos. Los resultados dependen de varios factores, como los objetivos de DQ, el conjunto de datos agregado, cómo se integran esos datos y el calibre del conjunto de datos antes del enriquecimiento.

Para ilustrar este punto, tomemos un ejemplo creado con la ayuda de ChatGPT. Una empresa inicia el proceso con los registros de su departamento de marketing, como se muestra a continuación:

Fuente: ChatGPT

Para mejorar la calidad de los datos para una próxima campaña, el gerente de la empresa compra datos de terceros para completar los correos electrónicos que faltan y recopilar detalles adicionales sobre la edad. No se hace nada más con los datos existentes de la organización. Una vez finalizado el enriquecimiento de datos, TI envía los registros actualizados de los clientes a marketing por su esfuerzo.

Fuente: ChatGPT

Si bien los especialistas en marketing pueden dirigirse a clientes mayores de 40 años, utilizar los datos enriquecidos resulta difícil. ¿El nombre del Sr. Johnson es Mike? ¿Se ha actualizado correctamente el correo electrónico de Sarah Miller desde sarah.miller@verizon.com a la dirección email.com? ¿Qué pasa si los especialistas en marketing necesitan una dirección de correo electrónico corporativa en lugar de una personal para cumplir con las leyes de protección de datos?

Los especialistas en marketing o TI pueden completar manualmente los datos o utilizar una herramienta de calidad de datos para corregir discrepancias. Pero obtener una dirección de correo electrónico corporativa requeriría mucho tiempo para agregarla de forma retroactiva.

En este caso, el enriquecimiento de datos no afectó ni disminuyó la calidad de los datos. Sin embargo, a la empresa le cuesta más ordenar los resultados. Cuando se escala a través de miles de registros, las consecuencias de esta táctica conducen a un desorden de datos.

Implementación de un programa sólido de calidad de datos 

El ejemplo anterior muestra por qué las empresas necesitan implementar una sólida Programa de calidad de datos antes del enriquecimiento. Administradores de datos están en el centro de este esfuerzo, ya que están designados para administrar y mantener sus conjuntos de datos en buen estado, de acuerdo con una definición DQ consistente. 

Los administradores de datos operan en un programa DQ a través de responsables Gobierno de datos, un servicio que formaliza y armoniza funciones de datos, comunicaciones, procesos y mediciones entre los equipos de la empresa. La Gobernanza Responsable de Datos guía el programa de Calidad de Datos y respalda su propósito, componentes esenciales y tácticas de DQ, incluido el enriquecimiento de datos. 

Por ejemplo, considere el equipo de marketing del ejemplo anterior. A través de los servicios de Gobierno de datos, el equipo podría designar un administrador de datos del equipo de marketing, actualizar la empresa y automatizar los procesos de limpieza de datos. De esa manera, antes de iniciar cualquier proceso de enriquecimiento, la empresa podría marcar y resolver las entradas a las que les faltan detalles críticos, como un nombre y un correo electrónico.

Dado que alcanzar una definición DQ consistente es iterativo, las empresas deben regularmente monitorear y corregir DQ para reducir los riesgos de datos inexactos, asegurando suficiente confianza e integridad en sus datos antes de agregar más registros. Especialmente cuando las empresas recopilan datos en streaming o en tiempo real, deben evaluar y limpiar los datos de forma rutinaria.

Además, contar con un programa DQ atendido por un gobierno de datos responsable minimiza los riesgos de violar las regulaciones de datos, como el RGPD. Por ejemplo, integrar datos demográficos adicionales de otras fuentes con clientes europeos sin consentimiento explícito puede dar lugar a multas significativas. Transferencias de datos de una fuente a otra están sujetos a protecciones legales, lo que hace imperativo un programa DQ con servicios de Gobierno de Datos antes del enriquecimiento.

Aplicación del enriquecimiento de datos para mejorar la calidad de los datos

Una vez que una organización ha establecido un programa sólido de calidad de datos y ha logrado avances suficientes en la posesión de activos de datos adecuados, incluso si son pequeños y específicos, debería considerar el enriquecimiento de los datos para seguir mejorando la calidad de datos. Esta táctica contribuye a mejorar el DQ a través de una mayor granularidad cuando se ejecuta bien. Los ejemplos incluyen los siguientes:

  • Vevo implementado anuncios dirigidos y segmentación del mercado en 35 plataformas de TV conectada (CTV) utilizando datos de identidad de AnalyticsIQ.
  • Un parque temático aumentó su asistencia e ingresos durante la pandemia de COVID-19 conduciendo 15% Mayores conversiones, 117 % más visitas a la página de destino y un 62 % menos de costo por vista de la página de destino.
  • Las Naciones Unidas adoptaron una sostenibilidad de 15 años plan, incluidos los Objetivos de Desarrollo Sostenible (ODS), y una mejor calidad de los datos en torno a los indicadores de desempeño para que puedan ayudar a otros países a tomar decisiones estratégicas basadas en evidencia.
  • Las agencias de seguros aprovecharon el enriquecimiento geoespacial, añadiendo Información sobre la ubicación a sus clientes. Esta práctica permitió una evaluación más completa de los riesgos de propiedad e hizo que las tarifas de los seguros fueran más realistas.
  • American Express redujo significativamente las transacciones fraudulentas en 60% mediante el enriquecimiento de datos. La empresa reforzó sus datos con contexto agregando direcciones IP, direcciones de correo electrónico y direcciones de envío proporcionadas por los comerciantes. American Express cruzó estos datos mejorados con la información almacenada en sus sistemas, lo que demuestra un caso de uso exitoso en la prevención del fraude.

Conclusión

Como muestran los casos de uso anteriores, el enriquecimiento de datos puede funcionar para mejorar la calidad de los datos. Cuando esto sucede, las organizaciones ven una mejora significativa y visible hacia sus objetivos comerciales con imágenes más precisas de sus clientes, objetivos de desempeño y activos. 

Sin embargo, estos resultados requieren que las corporaciones trabajen para establecer un programa DQ con apoyo responsable de Gobernanza de Datos. De esa manera, las organizaciones conocen las mejores tácticas para que la DQ sea aceptable y las aplican en el momento adecuado. Una vez empresas conectamos sus tácticas de DQ con los recursos disponibles asignados para su programa de DQ, deberían considerar el enriquecimiento de datos para impulsar decisiones y abrir oportunidades de negocio.

punto_img

Información más reciente

punto_img