Con Amazon EMR 6.15, lanzamos controles de acceso detallados (FGAC) basados en AWS Lake Formation en formatos de tabla abierta (OTF), incluidos Apache Hudi, Apache Iceberg,...
Esta es una publicación invitada coescrita con Mukul Sharma, ingeniero de desarrollo de software, y Ozcan IIikhan, director de ingeniería de GoDaddy. GoDaddy empodera a los emprendedores cotidianos...
Amazon EMR Serverless proporciona un entorno de ejecución sin servidor que simplifica el funcionamiento de aplicaciones de análisis que utilizan los últimos marcos de código abierto, como Apache Spark...
En 2022, le contamos sobre las nuevas mejoras que realizamos en Amazon EMR Managed Scaling, que ayudaron a mejorar la utilización del clúster, así como...
Esta publicación está escrita en colaboración con Elijah Ball de Ontraport. Los clientes están implementando cargas de trabajo de análisis y datos en la nube de AWS para optimizar...
Apache Hive es un sistema de almacenamiento de datos basado en SQL para procesar conjuntos de datos altamente distribuidos en la plataforma Apache Hadoop. Hay dos componentes clave para...
En la era digital actual, el registro es un aspecto crítico del desarrollo y la administración de aplicaciones, pero administrar registros de manera eficiente mientras se cumple con las normas de protección de datos...
Recientemente anunciamos la compatibilidad con las políticas de control de acceso detalladas de AWS Lake Formation en consultas de Amazon Athena para datos almacenados en cualquier formato de archivo compatible...
Amazon SageMaker Data Wrangler reduce el tiempo que lleva agregar y preparar datos para el aprendizaje automático (ML) de semanas a minutos en Amazon...
Introducción Apache Flume es una herramienta/servicio/mecanismo de ingesta de datos para recopilar, agregar y entregar grandes cantidades de datos de transmisión de diversas fuentes, como archivos de registro,...
Introducción Big Data es un conjunto de datos grande y complejo generado por varias fuentes y crece exponencialmente. Es tan extenso y diverso que los datos tradicionales...