Logotipo de Zephyrnet

Etiqueta: Marco de datos

Elaboración de una canalización de ETL sin servidor con AWS Glue y PySpark

ETL (Extraer, Transformar y Cargar) es una técnica muy común en la ingeniería de datos. Se trata de extraer los datos operativos de varias fuentes, transformándolos...

Tutorial Streamlit: creación de aplicaciones web con ejemplos de código

Este artículo fue publicado como parte del Blogathon de ciencia de datos. Introducción Streamlit es una herramienta de código abierto para crear e implementar aplicaciones de datos con menos...

Introducción al Control Sintético usando la Coincidencia de Puntuación de Propensión

Este artículo fue publicado como parte del Blogathon de ciencia de datos. Aquí hay un secreto, los métodos de control sintético pueden resolver este problema con suma...

Principales 170 preguntas y respuestas de entrevistas de aprendizaje automático (2023)

Tabla de contenido Una entrevista de aprendizaje automático exige una preparación rigurosa, ya que los candidatos son evaluados en varios aspectos, como aspectos técnicos y...

Acelere el desarrollo de ML con SageMaker Feature Store y la compactación de tiendas fuera de línea Apache Iceberg

Hoy en día, las empresas están estableciendo tiendas de funciones para proporcionar un repositorio central para escalar el desarrollo de ML en unidades comerciales y equipos de ciencia de datos. Como característica...

Tutorial de PyTorch de YOLOv5

YOLO, acrónimo de 'Solo miras una vez', es una herramienta de software de código abierto que se utiliza por su capacidad eficiente de detectar objetos en un...

Cómo anonimizar lugares en Python

Foto de Max Chen en Unsplash En este artículo, ilustro cómo identificar y anonimizar lugares en Python, sin el uso de técnicas de PNL, como Named...

Cinco formas de hacer filtrado condicional en Pandas

Imagen del editor Cuando comencé mi viaje hacia la ciencia de datos, aprendí R como mi primer lenguaje de programación. Me familiaricé mucho con...

Explore su lago de datos con Amazon Athena para Apache Spark

Amazon Athena ahora permite que los analistas de datos y los ingenieros de datos disfruten de la experiencia sin servidor, interactiva y fácil de usar de Athena con Apache Spark, además de...

Lo que Google le recomienda que haga antes de realizar su curso de ciencia de datos o aprendizaje automático

Imagen del autor Ya sea el curso ML/DL de Andrew Ng en YouTube o cualquier Bootcamp de ciencia de datos, necesitará un cierto grado de matemáticas y...

Presentamos AWS Glue for Ray: cómo escalar sus cargas de trabajo de integración de datos mediante Python

AWS Glue es un servicio de integración de datos sin servidor que simplifica el descubrimiento, la preparación, el traslado y la integración de datos de múltiples fuentes para análisis,...

Optimice los hiperparámetros con Amazon SageMaker Automatic Model Tuning

Los modelos de aprendizaje automático (ML) están conquistando el mundo. Su rendimiento depende del uso de los datos de entrenamiento correctos y de la elección del modelo correcto...

Información más reciente

punto_img
punto_img