La construcción de aplicaciones de big data basadas en software de código abierto se ha vuelto cada vez más sencilla desde la llegada de proyectos como Data on EKS,...
Apache Hive es un sistema de almacenamiento de datos basado en SQL para procesar conjuntos de datos altamente distribuidos en la plataforma Apache Hadoop. Hay dos componentes clave para...
Sidney Perkowitz descubre el legado científico del físico nuclear, quien superó grandes adversidades para convertirse en un reconocido investigador y defensor...
Imagen del autor En la década de 1970, Edgar F. Codd propuso el modelo de base de datos relacional, comúnmente conocido como base de datos SQL. Estas bases de datos están diseñadas principalmente...
Introducción Apache Flume es una herramienta/servicio/mecanismo de ingesta de datos para recopilar, agregar y entregar grandes cantidades de datos de transmisión de diversas fuentes, como archivos de registro,...
Introducción Amazon Athena es una herramienta de consulta interactiva proporcionada por Amazon Web Services (AWS) que le permite utilizar consultas SQL convencionales para evaluar datos...
Introducción Big Data es un conjunto de datos grande y complejo generado por varias fuentes y crece exponencialmente. Es tan extenso y diverso que los datos tradicionales...
Introducción Azure data factory (ADF) es una herramienta de ingesta de datos basada en la nube y ETL (Extracción, Transformación, Carga). El flujo de trabajo basado en datos en ADF organiza y automatiza datos...
¿Cuánto cuesta desarrollar una aplicación de salón bajo demanda como Glamsquad? Las aplicaciones móviles son puentes entre las organizaciones y los clientes finales. Los avances en...
Amazon EMR proporciona un marco Apache Hadoop administrado que hace que la ejecución de Apache HBase sea sencilla, rápida y rentable. Apache HBase es masivamente...
En la publicación Presentación de la herramienta de TCO del kit de entrega de migración de Hadoop de AWS ProServe, presentamos el TCO del kit de entrega de migración de Hadoop de AWS ProServe (HMDK)...
Amazon EMR proporciona un servicio administrado para ejecutar fácilmente aplicaciones de análisis mediante marcos de trabajo de código abierto como Apache Spark, Hive, Presto, Trino, HBase y Flink....
El gobierno de datos es el conjunto de políticas, procesos y sistemas que utilizan las organizaciones para garantizar la calidad y el manejo adecuado de sus datos en todo...