Logotipo de Zephyrnet

Explorando el mundo real de la ciencia de datos

Fecha:

Explorando el mundo real de la ciencia de datos

Un artículo que destaca las cosas que he aprendido en el mundo real sobre la ciencia de datos.


By Dhilip Subramanian, Científico de datos y entusiasta de IA

Figura

Imagen cortesía de Atika Maan

La ciencia de datos, el aprendizaje automático y la inteligencia artificial han sido dominios candentes durante algunos años. Muchas personas quieren trabajar como científicos de datos y están haciendo un gran esfuerzo para mejorar sus habilidades a través de la universidad, cursos en línea o autoestudio. Sin embargo, existen muchos desafíos en el mundo real en términos de trabajar y resolver un problema empresarial. Las habilidades no técnicas son igualmente importantes para trabajar como científico de datos. En este blog, comparto mi experiencia personal con la que me he encontrado en mi trabajo como científico de datos.

Comprender el problema empresarial

 
Hay muchos desafíos en el problema del mundo real que los estudiantes no necesariamente enfrentan en la Universidad. En la escuela, solían obtener un problema estructurado y un conjunto de datos popular y, finalmente, obtener la solución exacta. Sin embargo, el problema en la industria a menudo será desestructurado y complejo. Cualquier suposición sobre el problema será contraproducente en el mundo real. Es mejor comprender completamente el problema empresarial antes de sumergirse en el análisis. Comprender los problemas comerciales implica investigar más el problema y su dominio, planificar, hacer las preguntas correctas a los clientes y discutir con los miembros del equipo.

Trabajo en equipo.

 
La ciencia de datos tiene que ver con el pensamiento lógico, generar más ideas y creatividad para resolver los problemas. Por lo tanto, el trabajo en equipo juega un papel importante en la ciencia de datos. También es necesario pensar de forma multidimensional en lugar de unidimensional. Los miembros del equipo pueden provenir de diversos orígenes con diferentes tipos de conjuntos de habilidades. Tome la fuerza de cada miembro del equipo y distribuya el trabajo en consecuencia. Esto me ayudó a resolver el problema de diferentes maneras y a aprender cosas nuevas.

Buen oyente

 
La otra habilidad clave es saber escuchar. La ciencia de datos se trata de compartir y colaborar. Básicamente, la persona necesita comprender las opiniones de los demás miembros del equipo. Muchas veces, otros miembros del equipo tienen buenas ideas y las ideas pueden ser únicas y es necesario escucharlas y comprenderlas para implementarlas con éxito en el proyecto. Como dije anteriormente, la ciencia de datos no es un espectáculo de un solo hombre y siempre es un esfuerzo de equipo.

Documentación

 
La ciencia de datos o IA es un campo en rápida evolución y, como resultado, siempre habrá algo nuevo y crucial que aprender. Es muy difícil recordar todo y la documentación me facilitó superar este desafío. Además, me ayudó a cristalizar mi propio proceso de pensamiento. Solía ​​documentar mis aprendizajes, análisis, proceso de modelo, experimentos y el código. Además, escribo mis experimentos fallidos y sus razones de manera detallada, y me ayudó a afinar mis ideas a largo plazo. Además de eso, me ayudó a mejorar mi comunicación y comprender los conceptos en detalle. Puede documentar incluso las pequeñas cosas que aprendió o encontró que marcan una gran diferencia a largo plazo. Utilice sus propias herramientas convenientes para documentar.

Entorno ágil

 
Trabajar en un entorno ágil me brinda una planificación, una priorización y una dirección claras al comienzo de cada sprint. Tener una mentalidad ágil ayuda a responder al cambio y a manejar la incertidumbre. Si se encuentra con incertidumbre, pruebe opciones, recopile comentarios y mejore de forma iterativa. También me dio la oportunidad de colaborar con diferentes equipos. Presentar un producto mínimo viable (MVP) en forma de modelo de aprendizaje automático al final de cada sprint a las partes interesadas me ayudó a dar forma a mis proyectos de una mejor forma. Además, los comentarios del final de cada sprint me ayudaron a corregir mis errores y entregar el proyecto de manera eficiente.

Storytelling

 
La narración es una parte importante de la ciencia de datos. Estamos analizando los datos, creando un modelo y encontrando los conocimientos. Pero, ¿qué dice este modelo en términos comerciales? En otras palabras, ¿cómo este modelo genera dinero para la empresa o soluciona el problema? Las partes interesadas y la administración no están interesadas en el valor p ni en ninguna otra estadística. El principal desafío aquí es explicar el modelo en términos más simples a una audiencia no técnica de una manera atractiva. Una forma de explicar el modelo a través de un cuento. Este es uno de mis mayores aprendizajes en el último año. Siempre, incluya una buena visualización y ayuda a transmitir el mensaje como una historia. Contar historias es un arte y requiere tiempo y mucha práctica.

Creatividad para mostrar el resultado.

 
Siempre utilizamos PPT tradicionales para mostrar nuestro trabajo a los clientes o partes interesadas. En lugar de PPT, ¿por qué no creamos una aplicación web o un panel para explicar el resultado de nuestro modelo? La creación de una aplicación web o un panel muestra el compromiso con el proyecto y también se conecta con las partes interesadas y los clientes.

Utilice siempre el control de versiones

 
El control de versiones es algo importante que todos incluyen en el flujo de trabajo. Ayuda a administrar sus códigos de manera centralizada en lugar de guardarlos en una PC / computadora portátil o en un disco externo. De esta manera, puede consultar el código o los documentos siempre que esté trabajando en un nuevo proyecto en cualquier ubicación.

Codificación

 
Mejoré significativamente mis habilidades de codificación durante los últimos 8 meses. Una cosa que he aprendido en mi trabajo, así como en las competiciones, es escribir código funcional u orientado a objetos para tener la máxima reutilización de código. Esto ayudará a utilizar el código en proyectos futuros y reducirá el tiempo en el actual. Solía ​​documentar la función del código cada vez que me refería a stackoverflow o google y esto me ayudó a aprender cosas nuevas sobre codificación. Siga siempre las mejores prácticas y mantenga su código fácil de leer.

Pedir ayuda

 
La ciencia de datos es una combinación de informática, estadísticas, aprendizaje automático y experiencia en el dominio. Por lo tanto, se requiere tener habilidades para manejar diferentes pasos, desde la limpieza de datos hasta la interpretación del modelo final y su implementación. No te dejes intimidar, no se puede dominar la ciencia de datos en un día. Así que si usted Si se encuentra en una situación difícil, no dude en pedir ayuda, a través de la cual obtendrá más conocimientos y, finalmente, le dará confianza en su enfoque.

¡Seguir aprendiendo!

 
La IA es el nuevo zumbido en la industria de la tecnología de la información y nos enfrentamos al hecho de que nadie puede asimilarlo todo en un corto período de tiempo. Decide tomarlo estratégicamente invirtiendo en una o dos horas todos los días para aprender nuevos conceptos y resolver nuevos problemas que incluirán aprender un nuevo algoritmo, codificar, leer un blog, hacer proyectos personales, etc. Aparte de todo esto, lo recomiendo encarecidamente. leer libros no técnicos que ayuden mucho en el flujo y la técnica de narración, que será un rasgo útil a medida que avancemos.

Pasión

 
Durante mis primeros días, tuve la impresión de que en este mundo analítico todos son maestros de todo. Pero luego me di cuenta de que mi suposición estaba equivocada. Entendí que es un proceso de aprendizaje continuo para todos aquí. Lo fundamental para mantenerse actualizado en este juego es el pasión, curiosidad y sed aprender más. Ya sea aprendizaje automático, aprendizaje profundo o PNL, siempre es la pasión la que resuelve problemas complicados.

Descargo de responsabilidad: este blog contiene mi experiencia personal. Si algo de esta información te ayudó, me encantaría saberlo.

¡Gracias por leer!

 
Bio: Dhilip Subramanian es ingeniero mecánico y ha completado su maestría en análisis. Tiene 9 años de experiencia con especialización en varios dominios relacionados con datos, incluidos TI, marketing, banca, energía y fabricación. Le apasiona la PNL y el aprendizaje automático. Es colaborador de la Comunidad SAS y le encanta escribir artículos técnicos sobre diversos aspectos de la ciencia de datos en la plataforma Medium.

Original. Publicado de nuevo con permiso.

Relacionado:

Fuente: https://www.kdnuggets.com/2020/06/exploring-real-world-data-science.html

punto_img

Información más reciente

punto_img