Logotipo de Zephyrnet

Tendencias laborales en análisis de datos: Parte 2 – KDnuggets

Fecha:

Por Andrea De Mauro y Mahantesh Pattadkal

 
A medida que continuamos desde donde lo dejamos en la Parte 1 de la serie de blogs "Tendencias laborales en análisis de datos“, continúa nuestro viaje a través del mundo de las tendencias laborales en análisis de datos y el papel del Procesamiento del Lenguaje Natural (NLP).
 

En la Parte 1, presentamos el “Tendencias laborales en análisis de datos"Aplicación, que consiste en recopilar datos y aplicar PNL para analizarlos, impulsada por Plataforma de análisis KNIME. Discutimos la fase de web scraping utilizada para recopilar datos en vivo sobre el mercado laboral de análisis de datos, seguida del proceso de limpieza de datos utilizando técnicas de PNL. Luego introdujimos un modelo temático que reveló siete conjuntos de habilidades homogéneas dentro de las ofertas de trabajo. Estos conjuntos de habilidades representan las competencias y actividades que los empleadores de diversas industrias buscan en los profesionales del análisis de datos.

En la segunda parte de la serie de blogs, describiremos los conjuntos de habilidades identificados y haremos algunas consideraciones respaldadas por datos sobre el panorama cambiante de las carreras profesionales en ciencia de datos.

 
Para etiquetar los conjuntos de habilidades, utilizamos los términos y ponderaciones más frecuentes identificados mediante el algoritmo LDA que se aplicó previamente a las ofertas de trabajo. Analizamos más a fondo las descripciones de puestos en cada tema para resaltar las actividades clave, las habilidades esenciales y las industrias donde se encuentran con mayor frecuencia. Comprender estos temas puede ayudar a quienes buscan empleo a alinear sus habilidades con las demandas del mercado y aumentar sus posibilidades de conseguir un puesto adecuado en el campo del análisis de datos. En los siguientes párrafos, encontrará una breve descripción de cada conjunto de habilidades.

Tema 0: Investigación y análisis de datos

 
La siguiente tabla muestra los cinco términos principales y sus ponderaciones para el tema 0. Las ponderaciones se refieren a la importancia del término al definir ese tema en particular. Considerando estos términos y los documentos etiquetados como tema 0, interpretamos este conjunto de habilidades como “Investigación y Análisis de Datos”.

Término Peso
Investigación 4510
Puesto de trabajo 4195
Información 4112
Salud 3404
University 2118

Tabla 0: Ponderaciones de términos para el tema 0
 

Este conjunto de habilidades abarca actividades como realizar investigaciones, analizar datos y proporcionar conocimientos que impulsen la toma de decisiones en diversos sectores. Como piedra angular del análisis de datos, este conjunto de habilidades facilita la extracción de información valiosa a partir de los datos, la identificación de tendencias y la toma de decisiones informadas.
De lo que recopilamos dentro del corpus de puestos de trabajo, los requisitos de competencia fundamentales relacionados con este conjunto de habilidades son:

  • Fuertes habilidades analíticas y de resolución de problemas.
  • Experiencia en software estadístico (R, Python) 
  • Experiencia con herramientas de visualización de datos.
  • Habilidades efectivas de comunicación y documentación.
  • Experiencia en el campo relevante (matemáticas, estadística o ciencia de datos)

Tema 1: Administración y atención al cliente

Al observar los términos y ponderaciones de la Tabla 1 y los documentos asociados con el Tema 1, decidimos etiquetarlo como "Administración y atención al cliente". Este conjunto de habilidades implica gestionar las interacciones con los clientes, brindar apoyo administrativo y coordinar procesos de logística o adquisiciones.

Término Peso
Soporte 2321
Administración 2307
Información 2134
Puesto de trabajo 2126
Local 1909

Tabla 1: Ponderaciones de términos para el tema 1
 

En nuestra opinión, las competencias fundamentales necesarias para tener éxito en trabajos que requieren este conjunto de habilidades son:

  • Fuertes capacidades de organización y gestión del tiempo.
  • Atención a los detalles
  • Dominio de software ofimático y herramientas de comunicación.
  • Excelentes habilidades interpersonales y de resolución de problemas.

Tema 2: Marketing y Gestión de Productos

Con base en los términos que se muestran en la Tabla 2, interpretamos que esto es el " Marketing y gestión de productos " Conjunto de habilidades.

Término Peso
Empresa 8487
Equipo 8021
Producto 6825
Local 3923
Marketing 3740

Tabla 2: Ponderaciones de términos para el tema 2
 

Este conjunto de habilidades gira en torno al desarrollo de estrategias de marketing, la gestión de los ciclos de vida de los productos y el impulso del crecimiento del mercado. Es vital en trabajos centrados en el análisis de datos, ya que permite a los profesionales utilizar conocimientos basados ​​en datos para tomar decisiones informadas sobre las tendencias del mercado, las preferencias de los clientes y el rendimiento del producto.

Las competencias esenciales requeridas dentro del conjunto de habilidades de marketing y gestión de productos son:

  • Fuertes habilidades de pensamiento analítico y estratégico.
  • Experiencia en investigación de mercados e inteligencia competitiva.
  • Experiencia con herramientas y plataformas de marketing.
  • Excelentes habilidades de comunicación y liderazgo.
  • Experiencia en negocios, marketing o un campo relacionado.

Tema 3: Gestión empresarial, gobernanza de datos y cumplimiento

Con base en los términos mostrados en la Tabla 2, concluimos que se refería al “Gestión empresarial, gobernanza de datos y cumplimiento " Conjunto de habilidades.

Este conjunto de habilidades abarca la supervisión de las operaciones comerciales, la garantía de la calidad y la seguridad de los datos y la gestión de riesgos y requisitos normativos. En trabajos con uso intensivo de análisis de datos, este conjunto de habilidades permite mantener la integridad de los datos, monitorear el cumplimiento, identificar riesgos y optimizar los procesos comerciales utilizando información basada en datos.

Término Peso
Empresa 14046
Administración 10531
Equipo 5835
ECONOMÉTRICOS 5672
Proyecto 4309

Tabla 3: Ponderaciones de términos para el tema 3
 

Según nuestros hallazgos, las competencias requeridas dentro de este conjunto de habilidades son:

  • Fuertes habilidades organizativas y de liderazgo.
  • Experiencia en gestión de datos, gobernanza de datos y evaluación de riesgos.
  • Experiencia con marcos regulatorios y estándares de la industria.
  • Habilidades de comunicación efectiva y resolución de problemas.
  • Experiencia en negocios, finanzas o un campo relacionado.

Tema 4: Inteligencia de Negocios y Visualización de Datos

Si observamos los términos que encontramos en el Tema 4, lo llamamos "Inteligencia de Negocios y Visualización de Datos" Conjunto de habilidades.

Este conjunto de habilidades implica diseñar soluciones de BI siempre presentes, como paneles e informes, crear visualizaciones detalladas y analizar datos para una toma de decisiones informada. Es fundamental en trabajos que aprovechan el análisis de datos, transformando datos sin procesar en conocimientos prácticos que impulsan decisiones estratégicas.

Término Peso
Empresa 19372
ECONOMÉTRICOS 7687
poder bi 7359
inteligencia 7040
Sql  5836

Tabla 4: Ponderaciones de términos para el tema 4
 

En nuestra opinión, los requisitos de competencia fundamentales dentro de BI y visualización de datos son:

  • Fuertes habilidades analíticas y de resolución de problemas.
  • Experiencia en herramientas de BI (como Power BI, Tableau, SQL)
  • Experiencia con técnicas de visualización de datos.
  • Habilidades efectivas de comunicación y narración.

Tema 5: Almacén de datos e infraestructura en la nube

Con base en los términos que se muestran en la Tabla 5, interpretamos que esto es el "Almacén de datos e infraestructura en la nube " Conjunto de habilidades.

Los puestos de trabajo que requieren un conjunto de habilidades en ingeniería de big data y en la nube generalmente están relacionados con actividades como el diseño e implementación de soluciones basadas en la nube, la gestión del procesamiento de datos a gran escala y el desarrollo de aplicaciones de software. Es vital en trabajos centrados en el análisis de datos, ya que permite el procesamiento y análisis eficiente de grandes volúmenes de datos para obtener información valiosa.

Término Peso
Desarrollo 4525
Soluciones 3998
Ingeniería 3692
Software 3510
Diseño 3494

Tabla 5: Ponderaciones de términos para el tema 5
 

En nuestra opinión, los requisitos de competencia fundamentales relacionados con el conjunto de habilidades son 

  • Fuertes habilidades de programación y resolución de problemas.
  • Experiencia en plataformas en la nube (como AWS, Azure y Google Cloud)
  • Experiencia con tecnologías de big data (como bases de datos Hadoop, Spark y NoSQL)
  • Conocimiento de políticas de Seguridad de la Información y procesos relacionados.

Tema 6: Aprendizaje automático

Con base en los términos que se muestran en la Tabla 6, interpretamos que esto es el "Aprendizaje automático (Machine learning & LLM) ”, que gira en torno al diseño de modelos de IA, la investigación de técnicas de aprendizaje automático de vanguardia y el desarrollo de soluciones de software inteligentes. En trabajos intensivos en análisis de datos, constituye la base para el entrenamiento del modelo de IA y la optimización del rendimiento.

Término Peso
Máquina 9782
Ciencia: 8861
Investigación 4686
Módulo 4209
Python 4053

Tabla 6: Ponderaciones de términos para el tema 6
 

Según nuestros hallazgos, las competencias fundamentales requeridas en el aprendizaje automático hoy en día son

  • Fuertes habilidades matemáticas y de programación.
  • Experiencia en marcos de aprendizaje automático (como TensorFlow, PyTorch)
  • Experiencia con técnicas avanzadas de IA (como aprendizaje profundo y procesamiento del lenguaje natural)
  • Habilidades de comunicación y colaboración efectivas. 

 
En esta entrega, nuestra atención se centra en el intrincado análisis de las asociaciones de conjuntos de habilidades que se revelan a través del modelado de temas en tres perfiles profesionales distintos: ingeniero de datos, analista de datos y científico de datos. Para alinear estos perfiles profesionales con las ofertas de trabajo, aprovechamos un clasificador basado en reglas. Este clasificador logró determinar la designación del perfil de una oferta de trabajo en función de las palabras clave que se encuentran dentro del título del trabajo. Por ejemplo, un puesto de trabajo titulado "Arquitecto de datos" se clasificaría como un puesto de ingeniero de datos, mientras que un puesto titulado "Ingeniero de aprendizaje automático" se atribuiría a la categoría de científico de datos. 

El uso del modelado de temas de asignación latente de Dirichlet (LDA) nos proporciona ponderaciones de temas para cada publicación de trabajo, que abarca siete conjuntos de habilidades distintas. Al calcular el peso medio de cada conjunto de habilidades en todos los perfiles profesionales, llegamos al peso promedio del conjunto de habilidades específico para cada rol. En particular, estas ponderaciones luego se normalizan y se representan como porcentajes.

Como se ilustra en la Figura 1, presentamos una visualización reveladora de la interacción entre las designaciones profesionales y los conjuntos de habilidades correspondientes. Esta imagen resume la anticipación colectiva de los empleadores con respecto a las competencias fundamentales cruciales para los ingenieros, analistas y científicos de datos.

Como se anticipó, el rol de ingeniero de datos requiere de manera destacada el dominio del conjunto de habilidades de “almacén de datos e infraestructura de nube”. Además, es imperativo tener conocimientos complementarios de visualización y aprendizaje automático. Este énfasis en la diversidad de habilidades se puede atribuir a la anticipación de que los ingenieros de datos serán parte integral del apoyo tanto a los analistas como a los científicos de datos.

Por el contrario, la experiencia primordial proyectada para los científicos de datos radica en el "aprendizaje automático", seguido de cerca por el dominio de las metodologías de "investigación". En particular, un conjunto de habilidades híbrido que abarca “Gestión empresarial” y “Gestión de productos” también ocupa un lugar destacado en importancia. Esto resume la intrincada gama de competencias que busca el mercado laboral para los aspirantes a científicos de datos.

Al centrar nuestra atención en el dominio del analista de datos, surge un requisito fundamental para el dominio de "BI y visualización". Dada su función en la generación de informes comerciales, la gestión de paneles y el seguimiento de la vitalidad empresarial, esto no sorprende. La demanda paralela de “Gestión Empresarial” como habilidad clave secundaria refleja la perspicacia estratégica que se espera de este rol. Además, al igual que el rol de científico de datos, existe un requisito paralelo de competencias en “Gestión de productos” e “Investigación” dentro del espectro de Analista de datos.

En resumen, esta exploración subraya el panorama matizado de los requisitos previos del conjunto de habilidades en varios roles de análisis de datos. Retrata las expectativas multifacéticas de los empleadores para los candidatos que aspiran a sobresalir en las capacidades de ingenieros de datos, analistas de datos y científicos de datos.

 

Figura 1: El gráfico de radar muestra la asociación entre los perfiles profesionales comparados con los conjuntos de habilidades que se muestran en dimensiones.
Figura 1: El gráfico de radar muestra la asociación entre los perfiles profesionales comparados con los conjuntos de habilidades que se muestran en dimensiones (haga clic para ampliar).
 

 
Nuestro análisis de ofertas de trabajo en el campo en expansión del análisis de datos tiene como objetivo categorizar los trabajos en función de distintos conjuntos de habilidades y aclarar la diversa gama de habilidades requeridas en cada categoría. Con el crecimiento exponencial en este dominio y la naturaleza crítica de las decisiones tomadas en base a datos, el proceso de recopilación, almacenamiento y análisis de datos ha experimentado avances notables, lo que ha llevado a una demanda insaciable de profesionales capacitados en análisis de datos.

A través de la clasificación de las ofertas de trabajo en siete temas de habilidades notables, arrojamos luz sobre la necesidad de habilidades tanto especializadas como multifacéticas en este campo que cambia rápidamente. Los temas abarcaron desde análisis de datos e inteligencia empresarial hasta aprendizaje automático e inteligencia artificial, subrayando la creciente demanda de personas expertas en aprovechar datos, tecnología y trabajo en equipo multifuncional.

No obstante, este estudio tiene varias limitaciones. La naturaleza dinámica del mercado laboral y el surgimiento de tecnologías y metodologías novedosas requieren una actualización continua de nuestro análisis en lugar de una visión estática “instantánea” como lo hicimos aquí. Además, es posible que nuestro enfoque no haya captado todos los matices de los diversos roles y habilidades laborales en el ámbito del análisis de datos, dada la dependencia de las ofertas de trabajo disponibles en el momento de la investigación.

Todo nuestro trabajo está disponible gratuitamente en Espacio público KNIME Community Hub – “Solicitud de competencia laboral”. Puede descargar y jugar con los flujos de trabajo para probarlos, descubrirlos usted mismo y ampliarlos o mejorarlos. 

 
 

 
De cara al futuro, vemos el potencial de una expansión considerable de este estudio. Esto incluye el desarrollo de componentes KNIME para implementar el método de 'eliminación de frases de parada', descrito en la Parte 1, y un marco de visualización interactivo humano en KNIME. Un marco de este tipo simplificaría el proceso del juicio humano a la hora de seleccionar el modelo de tema más coherente para un corpus determinado, mejorando la escala de nuestro trabajo. También imaginamos la aplicación de mecanismos asistidos por LLM para respaldar y simplificar la fase de modelado de temas: este escenario ciertamente deja espacio para más experimentación e investigación.

Los profesionales en el campo del análisis de datos deben permanecer informados y adaptables frente a las tecnologías emergentes. Esto garantiza que sus habilidades sigan siendo relevantes y valiosas en el panorama en constante cambio de la toma de decisiones basada en datos. Al reconocer y cultivar las habilidades relacionadas con los temas identificados, quienes buscan empleo pueden obtener una ventaja competitiva en este vibrante mercado. Para proteger su relevancia en el campo, los profesionales de análisis de datos deben mantener la curiosidad a lo largo de sus carreras y seguir aprendiendo continuamente.

 
 
Mahantesh Pattadkal aporta más de 6 años de experiencia en consultoría sobre proyectos y productos de ciencia de datos. Con una maestría en ciencia de datos, su experiencia brilla en aprendizaje profundo, procesamiento del lenguaje natural y aprendizaje automático explicable. Además, colabora activamente con la comunidad KNIME para colaborar en proyectos basados ​​en ciencia de datos.
 

Andrea De Mauro Tiene más de 15 años de experiencia formando equipos de análisis de negocios y ciencia de datos en empresas multinacionales como P&G y Vodafone. Además de su función corporativa, le gusta enseñar análisis de marketing y aprendizaje automático aplicado en varias universidades de Italia y Suiza. A través de sus investigaciones y escritos, ha explorado el impacto empresarial y social de los datos y la IA, convencido de que una alfabetización analítica más amplia mejorará el mundo. Su último libro es 'Data Analytics Made Easy', publicado por Packt. Apareció en la lista global 'Cuarenta menores de 2022' de 40 de la revista CDO.

punto_img

Información más reciente

punto_img