Las organizaciones suelen acumular volúmenes masivos de datos y continúan generando volúmenes de datos cada vez mayores, que van desde terabytes a petabytes y, en ocasiones, a exabytes de datos. Dichos datos generalmente se generan en sistemas dispares y requieren una agregación en una sola ubicación para el análisis y la generación de información. Una arquitectura de lago de datos le permite agregar […]
Un beneficio clave de una arquitectura de malla de datos es permitir que diferentes líneas de negocio (LOB) y unidades organizativas operen de forma independiente y ofrezcan sus datos como un producto. Este modelo no solo permite escalar a las organizaciones, sino que también otorga la propiedad de extremo a extremo del mantenimiento del producto a los productores de datos que son los expertos en el dominio de […]
La transmisión de trabajos de ETL en AWS Glue puede consumir datos de fuentes de transmisión como Amazon Kinesis y Apache Kafka, limpiar y transformar esos flujos de datos sobre la marcha, así como cargar continuamente los resultados en lagos de datos de Amazon Simple Storage Service (Amazon S3), datos almacenes u otros almacenes de datos. La naturaleza siempre activa de los trabajos de transmisión plantea […]