Logotipo de Zephyrnet

7 microcursos gratuitos de Kaggle para principiantes en ciencia de datos – KDnuggets

Fecha:

7 microcursos gratuitos de Kaggle para principiantes en ciencia de datos
Imagen del autor
 

¿Recuerdas ese curso de ciencia de datos en el que te inscribiste pero nunca pudiste terminar? Bueno, no estás solo.

La mayoría de los principiantes en ciencia de datos se inscriben en uno o más cursos: gratuitos o de pago. Pero debido a que los cursos de ciencia de datos generalmente cubren una amplia gama de temas (desde programación hasta análisis de datos, visualización y más), se necesitan varias semanas para analizarlos. E incluso si empiezan con fuerza, la mayoría de los alumnos empiezan a sentirse abrumados después de los primeros módulos y no logran progresar. Ingrese a los (micro)cursos de Kaggle. 

La serie de microcursos de Kaggle son una buena alternativa si le resultan más difíciles de completar cursos más largos. Son excelentes recursos para aprender habilidades de ciencia de datos (Python, pandas, aprendizaje automático y más) sin sentirse abrumado. Los cursos están diseñados de tal manera que solo toman unas pocas horas para completarlos e incluyen componentes de tutoría y práctica. Ahora repasemos algunos cursos para principiantes y lo que cubren.

Python es uno de los lenguajes más utilizados en ciencia de datos. Además de ayudarte en tu carrera de datos, Python también es útil si quieres ingresar a la ingeniería de software en algún momento. El curso de Python en Kaggle te ayudará a aprender lo siguiente:

  • Conceptos básicos de Python (sintaxis y variables) 
  • Clave 
  • Booleanos y condicionales 
  • Listas, bucles y listas por comprensión 
  • Cadenas y diccionarios 
  • Trabajar con bibliotecas externas

Si cree que necesita una introducción a la programación aún más sencilla antes de sumergirse en Python, puede consultar el introducción a la programación curso.

Debido a que los cursos posteriores sobre Pandas y visualización de datos requieren que se sienta cómodo con el contenido de este curso, no debe saltarse el curso de Python si es nuevo en la programación con Python.

Enlace: Aprende Python

Una vez que esté familiarizado con Python básico, podrá aprender pandas, una potente biblioteca de análisis y manipulación de datos.

A través de una serie de lecciones breves y ejercicios prácticos de codificación, el Los pandas le ayudará a aprender a realizar las siguientes operaciones en marcos de datos de pandas:

  • Crear, leer y escribir 
  • Indexar, seleccionar y asignar 
  • Cambiar el nombre y combinar 
  • Resumen de funciones y mapas. 
  • Agrupar y ordenar 
  • Tipos de datos y valores faltantes

Enlace: aprender pandas

Ahora que sabe cómo analizar datos con Python y pandas, es hora de aprovechar eso y aprender a visualizar sus datos.

El Visualización de datos El curso cubre los fundamentos de la creación de gráficos y diagramas útiles utilizando la biblioteca de Python Seaborn. El curso cubre lo siguiente:

  • Gráficos de líneas 
  • Gráficos de barras y mapas de calor. 
  • Gráfico de dispersión
  • Histogramas y gráficos de densidad. 
  • Elegir tipos de trama 

También necesitas trabajar en un proyecto final para aplicar lo aprendido.

Enlace: Aprenda la visualización de datos

SQL es la habilidad de ciencia de datos más esencial que puede aprender. Para comprender por qué SQL es muy importante para la ciencia de datos, lea "Por qué SQL es el lenguaje que se debe aprender para la ciencia de datos" por Nate Rosidi, colaborador de KDnuggets.

El Introducción a SQL El curso le enseñará cómo consultar conjuntos de datos con SQL utilizando el cliente BigQuery Python y cubrirá los fundamentos de SQL, el filtrado y la escritura de consultas SQL legibles:

  • Comenzando con SQL y BigQuery 
  • Seleccionar, desde y dónde 
  • Agrupar por, tener y contar 
  • Ordenar por 
  • como y con 
  • Uniendo datos 

Enlace: Aprenda la introducción a SQL

Ahora que se siente cómodo con los conceptos básicos de SQL, puede tomar la SQL avanzado curso para desarrollar aún más sus habilidades SQL. Este curso se basa en el curso de introducción a SQL y cubre los siguientes temas sobre cómo combinar datos de varias tablas y realizar operaciones más complejas:

  • Uniones y sindicatos 
  • Funciones analíticas 
  • Datos anidados y repetidos
  • Escribir consultas eficientes

Enlace: Aprenda SQL avanzado

Si ya ha completado los cursos anteriores, debería sentirse cómodo con la programación y el análisis de datos con Python y SQL. Ahora está listo para comenzar con el aprendizaje automático.

El Introducción al aprendizaje automático el curso cubre:

  • Cómo funcionan los modelos de aprendizaje automático 
  • Exploración de datos básicos 
  • Modelo de validación 
  • Desajuste y sobreajuste 
  • Bosques aleatorios 

También puede enviar una solicitud a una competencia de Kaggle para principiantes.

Enlace: Aprenda la introducción al aprendizaje automático 

El Aprendizaje automático intermedio El curso se basa en el curso de Introducción al aprendizaje automático y le enseña cómo manejar valores faltantes y variables categóricas y evitar el complicado problema de la fuga de datos al entrenar modelos de aprendizaje automático.

El tema cubierto incluye:

  • Valores faltantes 
  • Variables categóricas 
  • Canalizaciones de aprendizaje automático 
  • Validación cruzada 
  • XGBoost 
  • Fuga de datos

Enlace: Aprendizaje automático intermedio

Espero que este resumen de cursos le haya resultado útil. 

Como se mencionó, todos son gratuitos. Y solo se necesitan unas horas para aprender una habilidad esencial en ciencia de datos. Para que pueda comenzar su viaje hacia la ciencia de datos con un microcurso a la vez. ¡Feliz aprendizaje!
 
 

Bala Priya C. es un desarrollador y escritor técnico de la India. Le gusta trabajar en la intersección de matemáticas, programación, ciencia de datos y creación de contenido. Sus áreas de interés y experiencia incluyen DevOps, ciencia de datos y procesamiento de lenguaje natural. ¡Le gusta leer, escribir, codificar y tomar café! Actualmente, está trabajando para aprender y compartir su conocimiento con la comunidad de desarrolladores mediante la creación de tutoriales, guías prácticas, artículos de opinión y más.

punto_img

Información más reciente

punto_img