Logotipo de Zephyrnet

5 habilidades poco comunes en ciencia de datos que pueden ayudarlo a conseguir empleo – KDnuggets

Fecha:

5 habilidades poco comunes en ciencia de datos que pueden ayudarlo a conseguir empleo
Imagen del autor
 

Si sabes cómo crear un árbol de decisiones de aprendizaje automático, felicidades, tienes la oportunidad. Mismo nivel de experiencia en código. como ChatGPT y los miles de otros científicos de datos que compiten por el trabajo que desea.

Una tendencia fascinante entre los gerentes de contratación últimamente es que la capacidad de codificación en bruto ya no es suficiente. Para ser contratado, debe ir un paso más allá de conocer idiomas, marcos y cómo buscar en StackOverflow. Necesita mucha más comprensión conceptual y una comprensión del panorama actual de la ciencia de datos, incluidas cosas que cree que solo deberían preocupar al director ejecutivo de una empresa, como la gobernanza y la ética de los datos.

Hay muchos aspectos técnicos y no técnicos. habilidades de ciencia de datos Eso debería saberlo, pero si tiene dificultades para conseguir un empleo, estas habilidades de ciencia de datos menos comunes podrían ser el boleto para poner un pie en la puerta del empleo.

Anteriormente, los científicos de datos trabajaban de forma aislada, en oscuros sótanos subterráneos, produciendo modelos. Los modelos crearían predicciones o conocimientos; esos se pasarían a los ejecutivos de la alta dirección, quienes actuarían en consecuencia sin comprender el modelo que había producido estas predicciones. (Estoy exagerando un poco, pero no tanto).

Hoy en día, el liderazgo asume un papel mucho más activo en la comprensión de los productos de los científicos de datos. Eso significa que usted, como científico de datos, debe poder explicar por qué los modelos hacen lo que hacen, cómo funcionan y por qué se les ocurrió esa predicción en particular.

Si bien podría mostrarle a su jefe el código real que ejecuta su modelo, es mucho más útil (léase: empleable) poder mostrarle cómo funciona su modelo a través de la visualización. Por ejemplo, imagine que ha desarrollado un modelo de aprendizaje automático que predice la pérdida de clientes para una empresa de telecomunicaciones. En lugar de una captura de pantalla de sus líneas de código, podría utilizar un diagrama de flujo o un diagrama de árbol de decisiones para explicar visualmente cómo el modelo segmenta a los clientes e identifica aquellos en riesgo de abandono. Esto hace que la lógica del modelo sea transparente y más fácil de entender.

Saber cómo ilustrar código es una habilidad poco común, pero ciertamente vale la pena desarrollarla. Aún no hay cursos, pero te recomiendo que pruebes una herramienta gratuita como Miro para crear un diagrama de flujo que documente tu árbol de decisiones. Mejor aún, intente explicar su código a un amigo o familiar que no sea científico de datos. Cuanto más te pongas, mejor.

5 habilidades poco comunes en ciencia de datos que pueden ayudarlo a conseguir empleo
Imagen del autor
 

Muchos científicos de datos tienden a centrarse más en los algoritmos del modelo que en los matices de los datos de entrada. La ingeniería de funciones es el proceso de selección, modificación y creación de funciones (variables de entrada) para mejorar el rendimiento de los modelos de aprendizaje automático.

Por ejemplo, si está trabajando en un modelo predictivo de precios inmobiliarios, puede comenzar con características básicas como pies cuadrados, número de dormitorios y ubicación. Sin embargo, a través de la ingeniería de funciones, se pueden crear funciones con más matices. Puede calcular la distancia a la estación de transporte público más cercana o crear una función que represente la antigüedad de la propiedad. Incluso podría combinar funciones existentes para crear otras nuevas, como una “puntuación de conveniencia de ubicación” basada en las tasas de criminalidad, las calificaciones de las escuelas y la proximidad a los servicios.

Es una habilidad poco común porque requiere no sólo conocimientos técnicos, sino también un profundo conocimiento del dominio y creatividad. Necesitas realmente obtener sus datos y el problema en cuestión, y luego transforme creativamente los datos para hacerlos más útiles para el modelado.

La ingeniería de funciones suele tratarse como parte de cursos más amplios de aprendizaje automático en plataformas como Coursera, edX o Udacity. Pero creo que la mejor manera de aprender es a través de la experiencia práctica. Trabaje con datos del mundo real y experimente con diferentes estrategias de ingeniería de funciones.

Aquí hay una pregunta hipotética: imagina que eres un científico de datos en una empresa de atención médica. Se le ha encomendado la tarea de desarrollar un modelo predictivo para identificar pacientes en riesgo de padecer una determinada enfermedad. ¿Cuál será probablemente su mayor desafío?

Si respondió “lidiando con los pipelines ETL”, está equivocado. Es probable que su mayor desafío sea asegurarse de que su modelo no solo sea eficaz sino también compatible, ético y sostenible. Eso incluye garantizar que todos los datos que recopile para el modelo cumplan con regulaciones como HIPAA y GDPR, según su ubicación. Necesita saber cuándo es legal usar esos datos, cómo debe anonimizarlos, qué consentimiento requiere de los pacientes y cómo obtener ese consentimiento.

Y debe poder documentar fuentes de datos, transformaciones y decisiones de modelos para que un no experto pueda auditar el modelo. Esta trazabilidad es vital no sólo para el cumplimiento normativo sino también para futuras auditorías y mejoras de modelos.

Dónde aprender sobre gobernanza de datos: es denso, pero un gran recurso es el Comunidad global de gestión de datos.

 

5 habilidades poco comunes en ciencia de datos que pueden ayudarlo a conseguir empleo
Imagen de datosedo

"Sé que la ciencia de datos básicamente puede conocer estadísticas, crear modelos, encontrar tendencias, pero si me preguntas, no podría pensar en ningún dilema ético real, creo que la ciencia de datos simplemente revela los hechos reales". dijo Usuario de Reddit Carlos_tec17, erróneamente.

Más allá del cumplimiento legal, hay un aspecto ético a considerar. Debe asegurarse de que cualquier modelo que cree no introduzca inadvertidamente sesgos que podrían conducir a un trato desigual de ciertos grupos.

Me encanta el ejemplo de El antiguo modelo de contratación de Amazon para ilustrar por qué la ética es importante. Si no está familiarizado con esto, los científicos de datos de Amazon intentaron acelerar su flujo de trabajo de contratación creando un modelo que pudiera seleccionar contrataciones potenciales en función de sus currículums. El problema fue que entrenaron al modelo basándose en su base de currículums existente, que estaba muy dominada por hombres. Su nuevo modelo estaba sesgado hacia la contratación masculina. Eso es extremadamente poco ético.

Ya hemos superado la etapa de “moverse rápido y romper cosas” de la ciencia de datos. Ahora, como científico de datos, debes saber que tus decisiones tendrán un impacto real en las personas. La ignorancia ya no es una excusa; debe ser plenamente consciente de todas las posibles ramificaciones que podría tener su modelo y por qué toma las decisiones que toma.

UMichigan tiene una útil curso sobre la "ética de la ciencia de datos". También me gustó este libro para ilustrar por qué y cómo la ética surge incluso en ciencias “basadas en números” como la ciencia de datos.

Un truco secreto es que cuanto mejor sepa cómo comercializar, más fácil le resultará conseguir un trabajo. Y por "mercado" me refiero a "saber cómo hacer que las cosas sean atractivas". Con la capacidad de comercializar, podrá elaborar mejor un currículum que venda sus habilidades. Serás mejor encantando a un entrevistador. Y específicamente en ciencia de datos, podrá explicar mejor por qué su modelo (y los resultados de su modelo) son importantes.

Recuerde, no importa qué tan bueno sea su modelo si no puede convencer a nadie de que es necesario. Por ejemplo, imagine que ha desarrollado un modelo que puede predecir fallas en los equipos de una planta de fabricación. En teoría, su modelo podría ahorrarle a la empresa millones en tiempos de inactividad no planificados. Pero si no puede comunicar ese hecho a la alta dirección, su modelo languidecerá sin usarse en su computadora.

Con habilidades de marketing, puede demostrar el uso y la necesidad de su modelo con una presentación convincente que destaque los beneficios financieros, el potencial de mayor productividad y las ventajas a largo plazo de adoptar su modelo.

Esta es una habilidad muy poco común en el mundo de la ciencia de datos porque la mayoría de los científicos de datos son personas de números en el fondo. La mayoría de los aspirantes a científicos de datos realmente creen que simplemente hacer lo mejor que uno puede y mantener la cabeza gacha es una estrategia laboral ganadora. Desafortunadamente, no son las computadoras las que te contratan, sino las personas. Ser capaz de promocionarse a sí mismo, sus habilidades y sus productos es una ventaja real en el mercado laboral actual.

Para aprender a comercializar, recomiendo algunos cursos gratuitos para principiantes. como “Marketing en un mundo digital”, ofrecido por Coursera. Me gustó especialmente la sección sobre "Ofrecer ideas de productos que se mantengan en un mundo digital". No existen cursos de marketing específicos de ciencia de datos, pero me gustó esta entrada del blog que explica cómo promocionarse como científico de datos.

Es duro ahí fuera. A pesar de haber un crecimiento proyectado del empleo de científicos de datos, según la Oficina de Estadísticas Laborales, a muchos más aspirantes principiantes en ciencias de datos les resulta difícil conseguir un trabajo, as estos Reddit mensajes ilustrar. Hay competencia de ChatGPT y los buitres de despidos están dando vueltas.

Para competir y destacarse en el mercado laboral, hay que ir más allá de las habilidades técnicas. El gobierno de datos, la ética, la visualización de modelos, la ingeniería de funciones y las habilidades de marketing lo convierten en un candidato más reflexivo, sólido e intrigante para los gerentes de contratación.
 
 

Nate Rosidi es científico de datos y en estrategia de producto. También es profesor adjunto de enseñanza de análisis y es el fundador de StrataScratch, una plataforma que ayuda a los científicos de datos a prepararse para sus entrevistas con preguntas de entrevistas reales de las principales empresas. Conéctate con él en Gorjeo: StrataScratch or Etiqueta LinkedIn.

punto_img

Información más reciente

punto_img