Logotipo de Zephyrnet

Etiqueta: Big Data de AWS

Presentación de roles de tiempo de ejecución para los pasos de Amazon EMR: use roles de IAM y AWS Lake Formation para el control de acceso con Amazon EMR

Puede utilizar la API de pasos de Amazon EMR para enviar Apache Hive, Apache Spark y otros tipos de aplicaciones a un clúster de EMR. Tú...

Comience a utilizar Apache Hudi con AWS Glue mediante la implementación de conceptos clave de diseño: Parte 1

Muchas organizaciones construyen lagos de datos en Amazon Simple Storage Service (Amazon S3) utilizando una arquitectura moderna para una solución escalable y rentable. Almacenamiento de código abierto...

Cree rastreos incrementales de lagos de datos con tablas de catálogo de Glue existentes

AWS Glue incluye rastreadores, una capacidad que simplifica el descubrimiento de conjuntos de datos al escanear datos en Amazon Simple Storage Service (Amazon S3) y bases de datos relacionales,...

Control de versiones de código con AWS Glue Studio y GitHub

AWS Glue ahora ofrece integración con Git, un sistema de control de versiones de código abierto ampliamente utilizado en la comunidad de desarrolladores. Gracias a esta integración, puedes...

Actualice a la versión 3 del motor Athena para aumentar el rendimiento de las consultas y acceder a más funciones de análisis

Los clientes nos dicen que quieren tener un rendimiento más sólido y costos más bajos para sus aplicaciones y cargas de trabajo de análisis de datos. Los clientes también quieren usar...

Divida sus clústeres monolíticos de Apache Kafka con Amazon MSK Serverless

Hoy en día, muchas empresas están creando aplicaciones en tiempo real para mejorar la experiencia de sus clientes y obtener información inmediata de sus datos antes de que pierdan su valor...

Mejore las consultas federadas con pushdown de predicado en Amazon Athena

En las arquitecturas de datos modernas, es común almacenar datos en múltiples fuentes de datos. Sin embargo, las organizaciones que adoptan este enfoque aún necesitan información de sus datos...

Lleve los datos de las bases de datos a un lago de datos a escala utilizando planos de AWS Glue

Para crear un lago de datos en AWS, un patrón común de ingesta de datos es usar trabajos de AWS Glue para realizar operaciones de extracción, transformación y carga...

Ingiera datos de streaming en tablas de Apache Hudi mediante AWS Glue y Apache Hudi DeltaStreamer

En el mundo actual con la modernización de la tecnología, la necesidad de casos de uso de transmisión casi en tiempo real ha aumentado exponencialmente. Muchos clientes consumen continuamente datos de diferentes...

Patrones comunes de enriquecimiento de datos de transmisión en Amazon Kinesis Data Analytics para Apache Flink

El procesamiento de datos de transmisión le permite actuar sobre los datos en tiempo real. El análisis de datos en tiempo real puede ayudarlo a tener respuestas optimizadas y a tiempo mientras...

Administre sus conjuntos de datos de Amazon QuickSight de manera más eficiente con la nueva interfaz de usuario

Amazon QuickSight ha lanzado una nueva interfaz de usuario para la gestión de conjuntos de datos. Anteriormente, la experiencia de gestión de conjuntos de datos era un modal de diálogo emergente con espacio limitado,...

Automatice el archivo de datos para las tablas de series temporales de Amazon Redshift

Amazon Redshift es un almacén de datos en la nube rápido, escalable, seguro y completamente administrado que hace que analizar todos sus...

Información más reciente

punto_img
punto_img