Logotipo de Zephyrnet

Los mejores cursos de Python: un resumen de análisis

Fecha:

By Brendan Martín, Fundador y Editor en Jefe, AprenderDatosCiencia

Introducción

 
¿Qué revelan los datos si preguntamos: “¿Cuáles son los 10 mejores cursos de Python?”. La recopilación de casi todos los cursos de las principales plataformas muestra que hay mucho para elegir, con más de 3000 ofertas.

Este artículo resume mi análisis y presenta los tres mejores cursos. Para ver el artículo completo, que incluye todo el código necesario para reproducir mis resultados, consulte el original: Los 10 mejores cursos de Python según el análisis de datos.

TL;DR: Los ganadores

 
De todos los cursos recopilados, el análisis mostró que estos eran los tres primeros:

  1. Aprende Python por Codecademy
  2. Introducción a la programación Python por Udacity
  3. Programación para todos (Introducción a Python) de Coursera

Entonces, si solo está aquí para obtener recomendaciones, consulte los tres primeros. Sin embargo, si está interesado en los datos y métodos utilizados para generar los mejores resultados, continúe leyendo para obtener un resumen completo.

Compromisos y suposiciones

 
El análisis de datos requiere adoptar un enfoque reduccionista del mundo. A menudo, los datos deben seleccionarse debido a la probabilidad de que se correlacionen bien con una propiedad deseada. Tales compromisos y suposiciones son esenciales, pero también lo es la capacidad de establecer qué suposiciones hicimos. De esa manera, otros pueden criticar su enfoque y comprender sus limitaciones.

Supuestos:

  • Clasificación del motor de búsqueda de Google es un fiel reflejo tanto de la cantidad como de la calidad de los backlinks
  • Que la popularidad de la página de un curso se correlacione positivamente con su número de enlaces únicos
  • Que la popularidad de la página de un curso se correlacione positivamente con su tráfico
  • Que la selección de plataformas utilizadas en el análisis sea exhaustiva
  • Filtrar los datos de "Python" en la URL o la palabra clave principal de la página no excluyó ni incluyó cursos relevantes.

Limitaciones:

  • El proyecto Ahref básicos El plan utilizado proporciona los 50 mejores resultados de búsqueda en Google, no todo el conjunto posible.
  • La calificación de dominio de Ahref es solo una estimación del algoritmo secreto de Google

Preparación de datos

 
La preparación de los datos para el análisis suele ser el paso más exigente. En este caso, yo:

 
1. Exportó cada plataforma de curso en CSV separados.

Ya sabemos que necesitaremos filtrar más los datos para excluir ciertas páginas irrelevantes, pero eso es para más adelante.

 
2. Asegúrese de que nuestro entorno de Python tenga las bibliotecas necesarias: Los pandas, matplotlib/nacido en el mary scipy.

Estas bibliotecas ayudarán a explorar y visualizar los datos.

 
3. Cree un marco de datos vacío y concatene cada archivo en el marco de datos.

Dado que cada CSV tiene su propio índice, necesitamos reset_index para crear un nuevo índice para el marco de datos combinado.

 
4. Examine los datos para construir filtros significativos

Se trata de la cuestión mencionada en 1.

 
5. Eliminar duplicados

Por ejemplo, la URL puede ser "http" o "https" y puede tener o no www.

 
6. Ingeniería de funciones aplicada para crear un término de interacción entre los dominios de referencia y el tráfico.

Calcule las puntuaciones z del tráfico y los dominios de referencia para crear una nueva propiedad: el promedio de las dos puntuaciones z utilizando la biblioteca scipy.

 
7. Se iteró otra ronda de limpieza.

Por ejemplo, el curso de Codecademy para Python 2 se clasificó en la parte superior, pero fue reemplazado por Python 3. La solución: conservamos la posición de Codecademy y cambiamos el curso recomendado. Por ahora, el sentido común humano es un aporte crucial para este tipo de análisis.

Visualización de datos

 
Como es típico, la visualización de datos comenzó durante las etapas de preparación de datos. Ayuda a tener una idea de lo que está enturbiando las aguas.

Por ejemplo, una vez que los cursos fueron trazados por su tráfico y dominios de referencia, quedó claro que todavía teníamos que hacer una limpieza importante (paso 7 anterior) para eliminar los cursos irrelevantes. La siguiente gráfica muestra algunos cursos no relevantes que llegaron a los datos:

Los mejores cursos de Python: un resumen de análisis


 

Emprender la visualización generalmente requiere crear un nuevo marco de datos que agrupe los datos en el formato que necesita. Por ejemplo, los cursos de Python y el tráfico por plataforma como un gráfico de barras agrupadas:

Los mejores cursos de Python: un resumen de análisis


 

El gráfico anterior lleva a una observación interesante: más cursos relacionados con Python en una plataforma necesariamente significan más tráfico. Esto parece confirmar el dicho de que la calidad es más importante que la cantidad.

Analisis cualitativo

 
El análisis cuantitativo nos dio nuestras clasificaciones. Para un análisis cualitativo de las versiones gratuitas de los cursos, me uní a ellos y salté para compartir mis impresiones.

 
1. Aprende Python por Codecademy

Certificado: ✔ Cuestionarios: ✔ Proyectos: ✔ Interactivo: ✔

Un sólido curso de nivel principiante para resolver problemas con Python, que cubre temas fundamentales que a menudo son completamente ignorados por otros cursos.

 
2. Introducción a la programación Python por Udacity

Vídeo: ✔ Cuestionarios: ✔

Este curso para principiantes aún ofrece un buen valor a pesar de no impresionarme tanto como otros. Por ejemplo, a diferencia de Codecademy, cada lección tiene una conferencia grabada.

 
3. Programación para todos (Introducción a Python) de Coursera

Certificado: ✔ (con pago) Video: ✔ Cuestionarios: ✔

Los videos de este curso son mucho más organizados y entretenidos que otros que probé. El ritmo y el nivel de dificultad comienzan bajos, pero (eventualmente) lo llevan a un nivel intermedio de conocimiento de Python. El entorno de aprendizaje de Python está particularmente bien diseñado.

Conclusión

 
El curso de Codecademy parece una apuesta segura para comenzar tu viaje con Python. Pero, independientemente del curso que elija, aborde los proyectos con la mayor frecuencia posible. Encuentre un problema que le interese y siga programando hasta que tenga algo que lo resuelva. Muestre su solución, utilícela para ayudar a otros e incluso haga una carrera con ella. El uso de Python, y la programación en general, para crear valor para usted y para los demás es un ciclo de retroalimentación gratificante que lo mantendrá trabajando, avanzando y mejorando.

Esperamos que este artículo te ayude en tu viaje con Python. Revisar la articulo original para más detalles, código completo y el resto de los 10 principales.

 
 
Brendan Martín es fundador y editor en jefe, AprenderDatosCiencia. LearnDataSci está haciendo que el aprendizaje de la ciencia de datos en línea sea accesible para todos. Artículos mensuales orientados a ayudar a los estudiantes en línea a obtener una comprensión intuitiva de los temas de ciencia de datos y aprendizaje automático que son esenciales para las carreras de ciencia de datos.

punto_img

Información más reciente

punto_img