Logotipo de Zephyrnet

Si tuviera que comenzar a aprender ciencia de datos nuevamente, ¿cómo lo haría?

Fecha:

No hace mucho, comencé a pensar que si tuviera que comenzar a aprender aprendizaje automático y ciencia de datos nuevamente, ¿por dónde comenzaría? Lo gracioso fue que el camino que imaginé era completamente diferente al que realmente hice cuando estaba empezando.

Soy consciente de que todos aprendemos de diferentes maneras. Algunos prefieren videos, otros están de acuerdo con solo libros y muchas personas necesitan pagar por un curso para sentir más presión. Y eso está bien porque lo importante es aprender y disfrutarlo.

Entonces, hablando desde mi propia perspectiva y sabiendo cómo aprendo mejor, diseñé este camino si tuviera que comenzar a aprender Data Science nuevamente.

Como verás, mi forma favorita de aprender es ir de lo simple a lo complejo gradualmente. Esto significa comenzar con ejemplos prácticos y luego pasar a conceptos más abstractos.

Sé que puede ser extraño comenzar aquí, ya que muchos preferirían comenzar con las bases más sólidas y los videos matemáticos para comprender completamente lo que sucede detrás de cada modelo de ML. Pero desde mi perspectiva, comenzar con algo práctico y concreto ayuda a tener una mejor visión del panorama completo.

Además, estos microcursos tardan alrededor de 4 horas cada uno en completarse, por lo que cumplir esos pequeños objetivos por adelantado agrega un impulso adicional de motivación.

Micro-curso de Kaggle: Python

Si está familiarizado con Python, puede omitir esta parte. Aquí aprenderá conceptos básicos de Python que lo ayudarán a comenzar a aprender ciencia de datos. Habrá muchas cosas sobre Python que seguirán siendo un misterio. Pero a medida que avanzamos, lo aprenderás con la práctica.

Enlace: https://www.kaggle.com/learn/python

Precio: Gratis
 

Micro-curso de Kaggle: Pandas

Pandas nos dará las habilidades para comenzar a manipular datos en Python. Considero que un microcurso de 4 horas con ejemplos prácticos es suficiente para tener una noción de las cosas que se pueden hacer.

Enlace: https://www.kaggle.com/learn/pandas

Precio: Gratis
 

Micro-curso de Kaggle: visualización de datos

La visualización de datos es quizás una de las habilidades más subestimadas, pero es una de las más importantes. Le permitirá comprender completamente los datos con los que trabajará.

Enlace: https://www.kaggle.com/learn/data-visualization

Precio: Gratis

Microcurso de Kaggle: Introducción al aprendizaje automático

Aquí es donde comienza la parte emocionante. Vas a aprender conceptos básicos pero muy importantes para empezar a entrenar modelos de aprendizaje automático. Conceptos que luego será fundamental tenerlos muy claros.

Enlace: https://www.kaggle.com/learn/intro-to-machine-learning

Precio: Gratis

Micro-curso de Kaggle: aprendizaje automático intermedio

Esto es complementario al anterior, pero aquí vas a trabajar con variables categóricas por primera vez y lidiar con campos nulos en tus datos.

Enlace: https://www.kaggle.com/learn/intermediate-machine-learning

Precio: Gratis

Detengámonos aquí por un momento. Debe quedar claro que estos 5 microcursos no van a ser un proceso lineal, ya que probablemente tendrás que ir y venir entre ellos para refrescar conceptos. Cuando esté trabajando en Pandas, es posible que deba volver al curso de Python para recordar algunas de las cosas que aprendió o ir a la documentación de pandas para comprender las nuevas funciones que vio en el curso Introducción al aprendizaje automático. Y todo esto está bien, justo aquí es donde va a suceder el verdadero aprendizaje.

Ahora, se dará cuenta de que estos primeros 5 cursos le brindarán las habilidades necesarias para realizar análisis exploratorios de datos (EDA) y crear modelos de referencia que luego podrá mejorar. Entonces, ahora es el momento adecuado para comenzar con competencias simples de Kaggle y poner en práctica lo que ha aprendido.

Competencia Kaggle Playground: Titanic

Aquí pondrás en práctica lo que aprendiste en los cursos introductorios. Tal vez sea un poco intimidante al principio, pero no importa porque no se trata de ser el primero en la clasificación, se trata de aprender. En esta competencia, aprenderá sobre clasificación y métricas relevantes para este tipo de problemas, como precisión, recuperación y exactitud.

Enlace: https://www.kaggle.com/c/titanic

Concurso Kaggle Playground: precios de la vivienda

En esta competencia, aplicará modelos de regresión y aprenderá sobre métricas relevantes como RMSE.

Enlace: https://www.kaggle.com/c/home-data-for-ml-course

En este punto, ya tiene mucha experiencia práctica y sentirá que puede resolver muchos problemas, pero lo más probable es que no comprenda completamente lo que sucede detrás de cada algoritmo de clasificación y regresión que tiene. usó. Así que aquí es donde tenemos que estudiar el cimientos de lo que estamos aprendiendo.

Muchos cursos comienzan aquí, pero al menos absorbo mejor esta información una vez que he trabajado en algo práctico antes.

En este punto, nos separaremos momentáneamente de pandas, scikit-learn y otras bibliotecas de Python para aprender de manera práctica qué sucede “detrás” de estos algoritmos.

Este libro de Joel Grus es bastante amigable de leer, trae ejemplos en Python de cada uno de los temas, y no tiene mucha matemática pesada, lo cual es fundamental para esta etapa. Queremos entender el principio de los algoritmos, pero con una perspectiva práctica, no queremos desmotivarnos leyendo mucha notación matemática densa.

Enlace: Amazon

Precio: $42 aprox.

Si llegó hasta aquí, diría que es bastante capaz de trabajar en ciencia de datos y comprender los principios fundamentales detrás de las soluciones. Así que aquí te invito a seguir participando en concursos de Kaggle más complejos, participar en los foros y explorar nuevos métodos que encuentres en las soluciones de otros participantes.

Aquí vamos a ver muchas de las cosas que ya hemos aprendido pero lo vamos a ver explicado por uno de los líderes en el campo, y su enfoque va a ser más matemático por lo que será una excelente manera de entender nuestros modelos aún más.

Enlace: https://www.coursera.org/learn/machine-learning

Precio: Gratis sin el certificado - $ 79 con el certificado

Ahora comienza la parte matemática pesada. Imagínese si hubiéramos comenzado desde aquí, habría sido un camino cuesta arriba todo el tiempo y probablemente nos hubiéramos dado por vencidos más fácilmente.

Enlace: Amazon

Precio: $ 70, hay una versión oficial gratuita en el Stanford .

A estas alturas, probablemente ya haya leído sobre el aprendizaje profundo y haya jugado con algunos modelos. Pero aquí vamos a aprender las bases de qué son las redes neuronales, cómo funcionan y aprender a implementar y aplicar las diferentes arquitecturas que existen.

Enlace: https://www.deeplearning.ai/deep-learning-specialization/

Precio: $ 49 / mes

En este punto, depende mucho de tus propios intereses, y puedes enfocarte en problemas de regresión y series de tiempo o tal vez profundizar más en el aprendizaje profundo.

Original. Publicado de nuevo con permiso.

 
 
santiago viquez es creador de datasciencetrivia.com y físico convertido en científico de datos.

punto_img

Información más reciente

punto_img