Logotipo de Zephyrnet

Cómo aprender matemáticas para el aprendizaje automático

Fecha:

Cómo aprender matemáticas para el aprendizaje automático
Imagen de Geralt en Pixabay

 

Una de las preguntas más comunes que tienen los aspirantes a la ciencia de datos es “¿Cuánta matemática necesito saber para el aprendizaje automático?Los estudiantes que buscan ingresar al aprendizaje automático a menudo ven las matemáticas como una gran barrera de entrada.

Los guardianes de la industria no ayudan con esta preocupación, etiquetando a los estudiantes como no calificados a menos que tengan una maestría o un doctorado en el tema.

Entonces, ¿cuántas matemáticas necesitas saber para trabajar en la industria de la ciencia de datos?

La respuesta: No tanto como piensas.

La mayoría de las empresas resuelven casos de uso muy similares con la ayuda de datos. Requieren que los científicos de datos construyan modelos de aprendizaje automático que puedan predecir la rotación de clientes, realizar segmentaciones y pronosticar ventas. 

El enfoque utilizado para abordar estos problemas es similar y la tarea se vuelve bastante repetitiva. No hay necesidad de reinventar la rueda y utilizan algoritmos de aprendizaje automático listos para usar. 

Incluso si surge una situación en la que necesita crear un modelo de aprendizaje automático personalizado, una comprensión intuitiva de temas específicos es suficiente. No necesitas profundizar, y definitivamente no necesitas ser un experto en matemáticas para convertirte en un científico de datos.

Por ejemplo, sabemos que el descenso de gradiente se usa para encontrar la línea de mejor ajuste en la regresión lineal. No necesitas empezar a aprender a resolver ecuaciones diferenciales, simplemente necesitas entender los principios del cálculo para tener una idea de cómo se hace esto.

De manera similar, si tuviera que construir una red neuronal con Tensorflow, necesita realizar una gran cantidad de manipulación de matriz, pero lo hará con la ayuda de un programa de computadora. Debido a esto, no es necesario volver atrás y practicar la resolución de ecuaciones algebraicas. Solo necesitas entender cómo funcionan.

En este artículo, le indicaré los recursos que lo ayudarán a comenzar a aprender matemáticas para la ciencia de datos. Me concentraré en tres áreas: álgebra lineal, cálculo y estadística.

Álgebra lineal

 
Álgebra lineal: de los cimientos a las fronteras: Este curso en edX te enseñará álgebra lineal a nivel de pregrado. Comienza en un espacio lento, y podrá tomar este curso siempre que tenga conocimientos de matemáticas de nivel secundario.

La mejor parte de este curso es que te enseña álgebra lineal con ejemplos prácticos en Matlab, lo que te hace mirar el tema a través de la lente de los algoritmos y la programación. Este enfoque de aprendizaje es especialmente útil si su objetivo es aprender álgebra lineal para el aprendizaje automático.

Este curso puede ser auditado de forma gratuita. Si desea obtener un certificado de finalización, puede solicitar ayuda financiera.

3Blue1Brown — La esencia del álgebra lineal: No he tomado este curso antes, pero lo he encontrado muchas veces durante mi propia búsqueda de recursos de aprendizaje de matemáticas.

Muchos aspirantes al aprendizaje automático confían en este curso, ya que proporciona a los alumnos una comprensión conceptual del álgebra lineal. En lugar de aprender fórmulas arbitrarias o trabajar para derivarlas mecánicamente, obtendrá una intuición sobre cómo funciona el álgebra lineal. Esto es muy útil si su objetivo final es aplicar estos conceptos a los modelos de aprendizaje automático.

Cálculo

 
Hay dos cursos que recomiendo para aprender cálculo para el aprendizaje automático. El Esencia de cálculo es un excelente curso de introducción al cálculo de 3Blue1Brown. Nuevamente, esto le proporcionará una comprensión intuitiva de los conceptos de cálculo y profundizará para explicar el significado detrás de las fórmulas en lugar de solo hacer que las memorice.

A continuación, puede tomar 3Blue1Brown's Red neuronal serie. Si sabe cómo implementar redes neuronales usando bibliotecas como Keras, pero realmente no comprende el funcionamiento detrás de estos modelos, debe tomar este curso. Le proporciona una explicación completa del algoritmo de descenso de gradiente, junto con los conceptos de cálculo detrás de él.

 

Cómo aprender matemáticas para el aprendizaje automático
Calculus Made Easy 2nd ed, 1914, Capítulo 1 (editado por el autor del artículo para eliminar el lenguaje no inclusivo).

Estadística

 
Probabilidad y Estadística: ¿A p o no a p? — Coursera

Este es uno de los mejores cursos de introducción a la estadística que he tomado y lo ofrece la Universidad de Londres. Este curso está dirigido a estudiantes que se especializan en materias pesadas no matemáticas, como negocios y finanzas. 

Debido a esto, los conceptos estadísticos se explican de una manera simple y fácil de entender, con muchos ejemplos del mundo real.

Después de tomar este curso, comprenderá las estadísticas descriptivas e inferenciales, las diferentes distribuciones de muestreo, las técnicas de muestreo, los intervalos de confianza y cómo se calculan los valores p.

Todos estos conceptos tienen una aplicación directa al análisis de datos del mundo real.

Aprendizaje estadístico — edX

Este es otro excelente curso para aprender la intuición detrás de los modelos de aprendizaje automático. 

Al igual que los otros recursos de esta lista, este curso se centra menos en fórmulas matemáticas y explica los modelos de aprendizaje automático de forma conceptual.

Sin embargo, para tomar este curso, se recomienda tener algunos conocimientos de cálculo, ya que los instructores tienden a usar notación que, de lo contrario, podría confundirlo. 

Aprenderá conceptos como la regresión lineal y logística, junto con técnicas de regularización como la regresión de cresta y lazo y cuándo usarlas. Hay una conferencia completa dedicada a las técnicas utilizadas para mitigar el sobreajuste, y se explica la intuición matemática subyacente detrás de ellas.

Este es uno de los cursos más útiles que he tomado, ya que me ayudó a dejar de tratar los modelos de aprendizaje automático como cajas negras. Obtuve una comprensión de dónde se deben usar diferentes tipos de modelos, cuándo se debe aplicar la reducción de dimensionalidad y cuándo realizar diferentes tipos de técnicas de selección de características.

He pasado mucho tiempo tratando de volver atrás y aprender cálculo y álgebra lineal a nivel de pregrado. Sin embargo, a pesar de pasar mucho tiempo aprendiendo fórmulas y resolviendo ecuaciones diferenciales, hubo una desconexión en mi conocimiento, ya que nunca entendí bien cómo se relacionaban estos conceptos con los algoritmos de aprendizaje automático.

Los recursos anteriores son una excelente manera de romper esa barrera, ya que le brindan una comprensión conceptual de las matemáticas detrás del aprendizaje automático en lugar de llevarlo por la madriguera del conejo de fórmulas y teoremas complejos.

 
 
Natassha Selvaraj es un científico de datos autodidacta apasionado por la escritura. Puedes conectarte con ella en Etiqueta LinkedIn.

punto_img

Información más reciente

punto_img