Logotipo de Zephyrnet

Mejores prácticas para un equipo de datos moderno por @ttunguz

Fecha:

Los equipos de datos son convertirse en equipos de ingeniería de software.

El 14 de diciembre dimos la bienvenida Philip Zelitchenko, vicepresidente de datos de ZoomInfo, para hablar sobre cómo ha construido esta disciplina dentro de su equipo y fue fascinante. El el video está aquí.

[Contenido incrustado]

Al igual que el movimiento Devops, el movimiento Dataops tiene como objetivo escalar el uso de datos dentro de las empresas sin aumentar la plantilla del equipo de datos.

Para ello, Philip define productos de datos utilizando DPRD, estructura su equipo de datos con cinco funciones clave y define funciones claras entre el equipo de datos y otros miembros de la empresa.

Los DPRD, o documentos de requisitos de productos de datos, contienen información clave sobre un producto de datos: qué proporcionará, cómo producirá valor, cómo se regirán los datos, incluidas las alertas de calidad de los datos.

A diferencia del código, los datos son estocásticos o impredecibles. Los datos pueden cambiar de tamaño, forma, distribución o formato. Esto añade una dimensión adicional de complejidad a los DPRD.

Además del DPRD, el equipo de datos de ZoomInfo emplea TEP o plan de ejecución técnica que alinea a los equipos técnicos internos en arquitectura y gobernanza.

El equipo de datos tiene cinco funciones clave:

  1. PM de datos: mariscal de campo de los DPRD. Recopilan comentarios de los usuarios, definen el valor, solicitan comentarios del resto del equipo y luego gestionan la ejecución del plan.
  2. Lógica empresarial: el equipo de ingeniería de datos construye los canales ETL mientras que el equipo de ciencia de datos investiga e implementa algoritmos de aprendizaje automático para productos de datos impulsados ​​por MLDS.
  3. Analistas de datos: integrados/adscritos a los diferentes equipos operativos, los analistas analizan los datos que cada equipo necesita utilizando la infraestructura proporcionada por la plataforma de datos.
  4. Gobernanza de datos: garantiza la calidad/precisión de los datos, define las políticas de control de acceso para la seguridad, establece el procedimiento operativo para alertas y monitoreo y ayuda a definir contratos de datos entre productores, procesadores y consumidores.
  5. Plataforma de datos: construye la infraestructura de datos universal para la empresa.

Por último, el equipo de ZoomInfo está creando un producto interno llamado Heartbeat que mide el uso en los principales productos de datos, evalúa la prioridad, los SOP para el impacto en los SLA y la comunicación con los profesionales de datos de toda la organización de forma automatizada.

Para Philip, liderar el equipo de datos consiste en centrarse en los productos de datos que aportan un valor significativo a la empresa. Aprendí muchísimo sobre la forma en que operan los equipos de datos modernos, que aprovechan las disciplinas de ingeniería de software.

¡Gracias, Felipe!

punto_img

Información más reciente

punto_img