Logotipo de Zephyrnet

5 habilidades clave necesarias para convertirse en un gran científico de datos

Fecha:

By Sharan Kumar Ravindran, Gerente sénior (Ciencia de datos)

Uno no necesita tener un talento innato para convertirse en un científico de datos exitoso. Sin embargo, se requieren algunas habilidades para tener éxito en la ciencia de datos. Todas esas habilidades clave pueden ser adquiridas por cualquier persona con la capacitación y la práctica adecuadas. En este artículo, voy a compartir algunas de las habilidades importantes, por qué se consideran importantes para un científico de datos. Además, cómo se pueden adquirir esas habilidades.

Pensamiento crítico

 
 
Los científicos de datos deben desarrollar el hábito del pensamiento crítico. Ayuda a comprender mejor el problema. A menos que los problemas se entiendan al nivel más granular, la solución no puede ser buena. El pensamiento crítico ayuda a analizar las diferentes opciones y ayuda a elegir la correcta.

Al resolver problemas de ciencia de datos, no siempre es una decisión buena o mala. Muchas opciones se encuentran en el área gris entre lo bueno y lo malo. Hay tantas decisiones involucradas en un proyecto de ciencia de datos. Como elegir el conjunto correcto de atributos, la metodología correcta, los algoritmos correctos, las métricas correctas para medir el rendimiento del modelo, etc. Se requiere más análisis y pensamiento claro para elegir las opciones correctas.



Foto por Diana Parkhouse on Unsplash

 

Una forma sencilla de desarrollar el pensamiento crítico es ser tan curioso como un niño. Haga tantas preguntas como sea posible hasta que no haya más preguntas. Cuanto más preguntamos, más entendemos. Cuanto mejor entendamos el problema, mejor será el resultado.

Permítanme demostrar el pensamiento crítico con un ejemplo. Consideremos el siguiente escenario en una empresa de telecomunicaciones. Queremos identificar clientes leales y de alto poder adquisitivo. Para identificar este segmento de clientes, tendríamos que empezar con una serie de preguntas como,

  • ¿Cuáles son las diferentes categorías de perfil de los clientes?
  • ¿Cuál es la edad promedio de los clientes?
  • ¿Cuánto gasta un cliente?
  • ¿Cuál es la frecuencia con la que interactúa el cliente?
  • ¿El cliente ha estado pagando las facturas a tiempo?
  • ¿Ha habido algún pago atrasado o perdido?
  • ¿Cuál es el valor de por vida de los clientes?

Estos ayudan a identificar a los clientes de élite. Ayuda a la organización a garantizar que esos clientes experimenten el mejor servicio.

Existen técnicas que ayudan a mejorar la capacidad de pensamiento crítico. Una de esas técnicas es el pensamiento de primeros principios. Es un modelo mental que ayuda a comprender mejor el problema. Aquí hay un ejemplo del uso de los primeros principios para resolver un problema de ciencia de datos.

¿Cómo usar el pensamiento del primer principio para resolver problemas de ciencia de datos?
 

Los modelos mentales son herramientas asombrosas que ayudan a pensar con claridad y a tomar mejores decisiones. Por lo tanto, adoptar los modelos mentales ayuda a mejorar su capacidad de pensamiento crítico. Aquí hay un artículo que destaca los beneficios de adoptar modelos mentales en el trabajo.

5 modelos mentales para ayudar a impulsar su carrera en ciencia de datos
 

Codificación

 
 
Las habilidades de codificación son tan importantes para un científico de datos como lo son los ojos para un artista. Cualquier cosa que haga un científico de datos requiere habilidades de codificación. Desde leer datos de múltiples fuentes, realizar análisis exploratorios sobre los datos, construir modelos y evaluarlos.



Foto por Firos n.v. on Unsplash

 

¿Qué podría pasar con las soluciones de AutoML? Muchos productos de AutoML están surgiendo en los últimos años. Muchos incluso piensan que pronto no habrá necesidad de tener habilidades de codificación. Tomemos un ejemplo,

  • Hay 2 empresas, la empresa A y la empresa B.
  • Ambos utilizan el producto AutoML más popular.
  • Pueden resolver varios problemas de ciencia de datos usando AutoML
  • Ahora uno de ellos quiere dominar el mercado.
  • La empresa que pueda hacer más que la solución implementada mediante la solución AutoML tendrá una mejor oportunidad.

No hay negación, las soluciones de AutoML tendrán una adopción generalizada en el futuro. Muchos problemas estándar que el equipo de ciencia de datos resuelve hoy serán automatizados. No significa el fin de los trabajos de ciencia de datos o el fin de la necesidad de escribir código por parte de los científicos de datos. Permitirá que los equipos de ciencia de datos se centren en nuevos problemas.

La cantidad de datos que se capturan es muy alta hoy en día. En la actualidad, muchas organizaciones utilizan solo una fracción de los datos disponibles. Con AutoML, el enfoque cambiará a lo inexplorado.

¿Está interesado en la ciencia de datos pero siente que no tiene las habilidades de codificación? Aquí hay un artículo que lo ayudará a aprender a codificar para la ciencia de datos.

¿No puedes programar? Aquí está la mejor manera de aprender a codificar para la ciencia de datos

Matemáticas

 
 
Las matemáticas son otra habilidad importante que deben entender los científicos de datos. Estará bien que no esté al tanto de algunos de los conceptos matemáticos mientras aprende ciencia de datos. No será posible sobresalir como científico de datos sin comprender los conceptos matemáticos.



Foto por Este es Ingeniería RA Eng on Unsplash

 

Permítanme tomar un ejemplo simple y demostrar cómo los conceptos matemáticos son útiles para resolver problemas. Elijamos el análisis de abandono de clientes.

  • Comenzaremos con la comprensión del comportamiento y las características de diferentes conjuntos de clientes. Una forma de trabajar en esto es elegir diferentes datos de muestra y buscar patrones. El concepto matemático requerido aquí es la estadística y la probabilidad.
  • Para realizar eficientemente el análisis de datos, la comprensión del álgebra lineal será muy útil.
  • Digamos que queremos construir un modelo para predecir los usuarios que probablemente abandonarán. Para comprender los conceptos de descenso de gradiente, será útil el conocimiento del cálculo. Si está utilizando un árbol de decisiones, el conocimiento de la teoría de la información ayudará a comprender la lógica para construir árboles.
  • Si desea optimizar los parámetros, el conocimiento de la investigación y optimización de operaciones puede ser útil.
  • Para implementar de manera eficiente la evaluación del modelo, el concepto matemático como el álgebra puede ser muy útil.

Esto no es todo, no hay algoritmo de aprendizaje automático sin matemáticas. No significa que deba ser matemático para ser un científico de datos exitoso. Todo lo que requiere es un nivel de secundaria de matemáticas.

Si está interesado en aprender matemáticas para la ciencia de datos. Aquí está el mejor curso para ti.

Matemáticas para la ciencia de datos
 

Colaboración

 
 
Un científico de datos no puede trabajar de forma aislada. Un científico de datos debe colaborar con varias personas para garantizar el éxito del proyecto. Incluso hoy en día, muchos proyectos de ciencia de datos fracasan. La razón número uno de la mayoría de los fracasos es la falta de comprensión y colaboración entre los equipos.



Foto por Kaleidico on Unsplash

 

Explicar la importancia de la colaboración y el trabajo entre diferentes equipos. Consideremos un escenario en el que el equipo de ciencia de datos está trabajando con el equipo de crecimiento de clientes. El objetivo es entender el motivo de la rotación de clientes.

Decides hablar con algunos equipos diferentes y esto es lo que dicen

Equipo de crecimiento — La pérdida de clientes se debe principalmente a los descuentos agresivos que ofrecen las competiciones.

Marketing — La nueva característica lanzada por el equipo del producto podría estar causando algunos problemas, por lo que los clientes se perderían

Equipo de producto — El equipo de marketing solo se enfoca en atraer muchos clientes nuevos sin establecer el valor o la intención del cliente.

Atención al cliente Equipo — Ha habido muchos problemas relacionados con el pago informados por muchos clientes. Puede ser el motivo de la pérdida de clientes

Si no ha hablado con los otros equipos, habría comenzado a trabajar en el problema solo en función de los aportes proporcionados por el equipo de crecimiento. No puede resolver un problema simplemente confiando en los aportes de un solo equipo. Incluso si el equipo de crecimiento es el patrocinador principal aquí, no es suficiente confiar solo en los aportes proporcionados por ellos. Para obtener una imagen holística, debe hablar con un conjunto diferente de partes interesadas. Cuando limita las personas o los equipos con los que está trabajando, el sesgo de ellos se transmitirá a la solución que está construyendo.

Además, en muchos casos, el equipo de ciencia de datos debe trabajar en estrecha colaboración con la ingeniería de datos y los demás equipos de tecnología. Sin un buen esfuerzo de colaboración, no habrá éxito.

Comunicación y narración

 
 

  • Cantidad de esfuerzo invertido en el proyecto.
  • Precisión del modelo final de aprendizaje automático implementado en la producción
  • Perspectivas identificadas a partir del análisis exploratorio

Todo esto es inútil si las soluciones no se comunican bien a las partes interesadas. Los problemas y las soluciones involucradas en la ciencia de datos son generalmente mucho más complejos. Es muy importante simplificarlos antes de comunicarlos al negocio. El uso del enfoque de narración de historias en la comunicación ayuda mucho.

Permítanme tomar un ejemplo y explicar la importancia de una buena comunicación más simple. Consideremos el siguiente escenario. El equipo de ciencia de datos está trabajando en un modelo de pronóstico para predecir el uso de energía para los clientes minoristas de energía. El equipo de ciencia de datos debe convencer al equipo comercial y de infraestructura sobre la importancia de tener y ejecutar al menos 10 modelos diferentes para una mayor precisión. Esto significa un mayor uso de la potencia computacional y mucho más tiempo para entrenar los modelos.

Opción A — Se refiere a la técnica de agrupamiento utilizada para agrupar al cliente en diferentes grupos y, por lo tanto, dice que debe haber un modelo para cada uno de esos grupos.

El problema aquí es que el equipo comercial no ha sido informado sobre el beneficio de tener un modelo para cada uno de los grupos. Por lo tanto, es posible que no se convenzan si el costo resulta ser alto.

Opción B — Se empieza por el perfil y las características de los clientes. Muestra los patrones de uso de energía de los clientes. Muéstrele al equipo de negocios los patrones distintivos, como que algunos hogares usan energía casi insignificante durante el fin de semana, tal vez porque generalmente tienden a pasar el fin de semana en un lugar diferente. De manera similar, muestra los patrones distintivos y, por lo tanto, explica que un modelo no se ajustará a todos estos clientes diferentes y, por lo tanto, debe haber al menos 10 modelos diferentes cada uno para atender a las 10 categorías únicas diferentes de clientes.

Ahora, la empresa entiende la importancia de tener tantos modelos diferentes. Pueden comparar fácilmente el beneficio incremental con el costo de la infraestructura requerida para evaluar las opciones.

El trabajo del equipo de ciencia de datos es comunicar claramente la idea a las partes interesadas. No es un trabajo fácil ya que la mayoría de las personas tienen un conocimiento limitado sobre la ciencia de datos. Un proyecto de ciencia de datos se considera exitoso solo cuando la empresa encuentra valor en él.

Una buena forma de mejorar la colaboración en su organización sería proporcionar un entorno en el que haya un buen flujo de información entre los equipos.

Habilidades de liderazgo: es bueno tenerlas

 
 
Por último, pero no menos importante, están las habilidades de liderazgo. La mayoría de las organizaciones tienen un pequeño equipo de ciencia de datos y generalmente trabajan en diferentes conjuntos de problemas. Es muy común que un científico de datos se vea atraído por diferentes reuniones y por cuestionamientos Adhoc. Es trabajo del científico de datos decidir cuándo decir sí y cuándo decir no. Es muy importante establecer las prioridades correctamente.

Además, los científicos de datos deben tener un proceso de pensamiento claro y deben tener la capacidad de visualizar el resultado. Muchas veces habrá mucha presión por parte de los equipos comerciales para acelerar el análisis. El papel del científico de datos es gestionar las expectativas y producir un resultado de alta calidad.

Para permanecer conectado

 
 

 
Bio: Sharan Kumar Ravindran es gerente sénior (ciencia de datos), redactor principal en IA en Medium y líder en ciencia de datos con más de 10 años de experiencia. Escribe y habla sobre ciencia de datos con el objetivo de hacerla más accesible.

Original. Publicado de nuevo con permiso.

Relacionado:

Fuente: https://www.kdnuggets.com/2021/12/5-key-skills-needed-become-great-data-scientist.html

punto_img

Información más reciente

punto_img