Logotipo de Zephyrnet

Cómo una arquitectura de datos sin estado puede permitirle aprovechar el poder de los datos ágiles de hoy

Fecha:

Las tecnologías a veces se clasifican como con estado o sin estado. Los términos pueden aplicarse a aplicaciones o protocolos de comunicación, por ejemplo. Una aplicación con estado guarda los datos generados por cada sesión del cliente y los utiliza la próxima vez que el cliente realiza una solicitud. Una aplicación sin estado no guarda los datos del cliente de una sesión a la siguiente.

También podemos referirnos a los datos como con estado o sin estado. Tradicionalmente pensamos en los datos como con estado: una vez que se crean, siempre existen. Pero las organizaciones están descubriendo que los datos deben ser cada vez más sin estado, por un par de razones. 

ECHA UN VISTAZO A NUESTRO PROGRAMA DE FORMACIÓN EN ARQUITECTURA DE DATOS

Si encuentra este artículo de interés, puede disfrutar de nuestros cursos en línea sobre los fundamentos de la arquitectura de datos.

En primer lugar, los datos tienen una vida útil limitada. Esto se debe a que algunos datos tienen valor solo durante un período de tiempo específico, según su contexto. Lleva una alarma contra incendios. Para el comisionado de incendios, los datos de una alarma contra incendios tienen valor durante meses o años, ya que pueden revelar tendencias de incendios u otros conocimientos. Pero para la compañía de bomberos, los datos tienen valor solo por unos minutos.

En segundo lugar, los datos se ven afectados por su geolocalización. Para empezar, los datos ya no residen en un solo lugar, ya que partes de un conjunto de datos se pueden generar en múltiples ubicaciones. Además, si los datos son útiles a menudo depende de si se puede actuar o no.

Estas son más que preguntas académicas. La naturaleza ágil de los datos actuales está creando desafíos significativos en la forma en que las organizaciones obtienen, agregan, transforman, analizan y actúan sobre la información. La buena noticia es que ahora existen tecnologías y estrategias para crear una arquitectura de datos sin estado que puede optimizar el valor que obtienen las organizaciones a partir de sus datos cada vez más ágiles.

Tantos datos, tan poco tiempo

La gestión ágil de datos implica cuatro desafíos clave. Primero, los volúmenes masivos de datos que las organizaciones deben manejar hoy en día. Las fuentes de datos de los procesos comerciales, las entradas de los clientes, los sensores perimetrales y otras fuentes han crecido exponencialmente. Y las organizaciones se han vuelto cautelosas a la hora de tirarlo, porque saben que algún día podría generar información valiosa.

Lo siguiente es la naturaleza cada vez más en tiempo real de los datos. Una mayor parte de los datos que generan las organizaciones deben capturarse, comprenderse y actuar en consecuencia casi de inmediato. Un ejemplo son los datos que indican un ciberataque, que son más valiosos durante el breve período en el que puede tomar medidas para evitar una violación de datos.

En tercer lugar está el problema de la latencia. Los datos a menudo se distribuyen en vastas geografías. ¿Cómo se realiza en tiempo real? Analytics a través de fuentes de San Francisco, Chicago y Nueva York? ¿Transmite los datos a una ubicación central? ¿Puede agregar y analizar los datos cerca de sus fuentes?

El desafío final es el análisis profundo. Los datos de ciberataques pueden ayudarlo a reconocer actividades anómalas para proteger mejor los sistemas en el futuro. Pero también es valioso hacer un análisis profundo de los datos en tiempo real. Por ejemplo, el análisis en tiempo real de los datos de los sensores puede ayudar a que los equipos o vehículos funcionen de manera óptima en condiciones cambiantes.

Lograr una arquitectura de datos sin estado

Para conquistar los desafíos de los datos ágiles, las organizaciones deberán implementar una arquitectura de datos sin estado. Lograr ese objetivo requiere tres componentes clave:

1. Malla de datos globales. Las organizaciones deben alejarse de las bases de datos, los almacenes de datos y los lagos de datos. En su lugar, debe pensar en términos de una red de datos global o malla de datos. Una malla de datos global abstrae la complejidad de administrar datos y aplicaciones por separado para que los datos no tengan estado.

Una malla de datos le permite acercar de forma inteligente los datos a la computación y el análisis, o acercar la computación y el análisis a los datos. Eso le brinda una gran flexibilidad en la forma en que realiza el análisis de datos o implementa aplicaciones.

Pero una malla de datos no se trata simplemente de procesar datos en el borde. Más bien, le permite procesar datos en cualquier lugar y en todas partes. Conecta datos a través de límites físicos, como centros de datos, nubes o geografías, y a través de límites lógicos, como departamentos de la empresa o socios de la cadena de suministro. 

Una malla de datos le permite simplemente decirle al sistema que desea realizar análisis en un conjunto de datos. Luego, el sistema encontrará los datos, los agregará y colocará los análisis lo más cerca posible de los datos. Ya no tiene que seguir preguntando, “¿Dónde están los datos? ¿Está en la nube? ¿Está en el borde? ¿Se ha replicado? Todo eso lo maneja la malla de datos.

Igual de importante, una malla de datos hace que sus datos sean fungibles, porque puede transformar los datos en una API. Una vez que los datos son una API, puede conectarlos a nubes, aplicaciones, paneles, flujos de trabajo y más.

2. Marco distribuido. Una arquitectura de datos sin estado también requiere un marco distribuido. Hoy en día, la mayoría de las organizaciones envían datos a la nube, porque ahí es donde está su cómputo. Pero para administrar datos ágiles, debe ejecutar análisis, aprendizaje automático (ML) e inteligencia artificial (AI) localmente, donde los datos tienen valor.

Un marco distribuido implica un conjunto de servicios de datos que tienen estado y que asumen la responsabilidad de administrar el estado con coherencia, garantías de precisión y garantías de replicación con límite de tiempo. Los servicios de datos abstraen el estado de las aplicaciones que procesan los datos. De esa manera, cuando realiza análisis en conjuntos de datos dispersos geográficamente, los datos parecen no tener estado.

3. Protección e intercambio de datos globales. El elemento final de una arquitectura de datos sin estado implica la protección de datos y el intercambio seguro de datos. Es probable que su organización administre datos en jurisdicciones con regulaciones financieras y de privacidad que le impiden eliminar cierta información de su país de origen. Pero puede usar representaciones de metadatos de esa información. Puede tokenizar los datos y eliminar los tokens de esas jurisdicciones. 

Además, probablemente comparta datos con varias partes interesadas. Cada vez más, querrá exponer solo partes de sus conjuntos de datos a cada parte interesada. Puede lograrlo a través de la informática confidencial, que reserva una sección de la CPU de una computadora como un enclave seguro. Los datos en el enclave se cifran de manera que permanezcan cifrados incluso mientras los datos están en uso. Por lo tanto, puede permitir que las partes interesadas consulten aspectos específicos de un conjunto de datos sin ver todos los aspectos.

Casos de uso tan ilimitados como sus datos

La tecnología para lograr una arquitectura de datos sin estado ya está disponible y los casos de uso son prácticamente ilimitados. Aquí hay un ejemplo del sector público y la infraestructura crítica. California está lidiando con un clima cambiante que está provocando más picos en el uso de energía. También es el hogar de una creciente flota de vehículos eléctricos que exigen aún más una red eléctrica diseñada para cargas más pequeñas con menos picos.

El análisis en tiempo real de la transmisión de datos puede permitir a los operadores de la red seguir y predecir mejor los patrones de uso de electricidad en tiempo real. Podrían mapear exactamente cuándo y dónde los clientes industriales, comerciales y residenciales están encendiendo el aire acondicionado, cargando vehículos, encendiendo estufas, apagando luces, etc. Los operadores de centrales eléctricas, líneas de transmisión y redes de distribución podrían entonces hacer coincidir con precisión la demanda con la oferta, enrutando dinámicamente la electricidad en cantidades predecibles en tiempo real.

Cualquier empresa que necesite capturar y analizar datos ágiles en múltiples ubicaciones (organizaciones de servicios financieros, fabricación, comercio minorista, transporte, ciencias de la vida, sector público, etc.) puede beneficiarse de una arquitectura de datos sin estado. Probablemente ya esté imaginando cómo su organización también podría hacerlo.

punto_img

Información más reciente

punto_img

vidacienciav

café vc

café vc

vidacienciav