Logotipo de Zephyrnet

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos – KDnuggets

Fecha:

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos
Imagen por editor
 

ChatGPT se ha convertido en el producto OpenAI que cambia la forma en que funciona el mundo. Muchos de los lectores aquí ya los están usando o al menos probándolos. Por la forma en que nos ayuda, no creo que podamos volver a nuestra antigua forma de trabajar.

Una de las innovaciones que ofrece OpenAI es la Tienda GPT, donde las personas pueden desarrollar sus modelos GPT personalizados y compartirlos con el público. Más de 3 millones de GPT personalizados de ChatGPT de los creadores están abiertos. De hecho, parte de él podría ser útil para mejorar la actividad de los científicos de datos.

Este artículo analizará 7 GPT de GPT Store que podrían mejorar su flujo de trabajo de ciencia de datos. ¿Qué son estos GPT? Entremos en ello.

Como nota al margen, usaría el Conjunto de datos de abandono de telecomunicaciones de Kaggle como un conjunto de datos de ejemplo para que lo utilicen los GPT.

Comencemos con lo que los equipos de ChatGPT han creado para nosotros, el Analista de Datos. Este es el GPT personalizado, entrenado explícitamente para analizar nuestros datos y visualizarlos según necesitemos. Al soltar el archivo, como archivos CSV, y proporcionar el mensaje de lo que necesitamos, Data Analyst GPT podría hacer el trabajo automáticamente.

Por ejemplo, le pido al analista de datos que desarrolle un análisis de correlación de abandono a partir del conjunto de datos que le proporciono. 

 

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos
Analista de datos realiza análisis de correlación (Imagen del autor)
 

Puede solicitar más análisis al GPT del analista de datos. También puede utilizar GPT para proporcionar el código completo y ejecutarlo usted mismo si es necesario.

El próximo GPT que discutiremos es el Aprendizaje automático GPT. Este GPT personalizado está diseñado como asistente para cualquier actividad de ciencia de datos y aprendizaje automático. La utilidad incluye discutir, aprender y desarrollar algoritmos adecuados para nuestros proyectos de datos.

Como ejemplo, le pido al GPT de aprendizaje automático que realice el desarrollo de un modelo a partir de nuestro conjunto de datos de ejemplo para predecir la deserción. Aquí está el resultado.

 

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos
Machine Learning realiza experimentos modelo (Imagen del autor)
 

El GPT puede proporcionar una excelente comparación entre los modelos que utilizaron. Si continuamos, podemos pedirle al modelo que itere con más modelos, realizar un ajuste de hiperparámetros y pedirle al GPT que proporcione los motivos de cada acción.

Al igual que en la entrada anterior, el Ingeniero de Aprendizaje Automático GPT proporciona a los usuarios un asistente para desarrollar el modelo de aprendizaje automático. Puede poner su conjunto de datos y pedirle al GPT que le proporcione los pasos esenciales y el código completo.

Lo que diferencia al ingeniero de aprendizaje automático es que su GPT especifica el diseño de modelos para automatizar tareas complejas, especialmente para la implementación de modelos. El GPT es bueno para discutir cómo desea estructurar su modelo y cómo debe ser la implementación del modelo en producción.

Hablando de estructuración de modelos, GPT también es adecuado para ayudarnos a estructurar nuestro código para el modelado de aprendizaje automático. Uno de los mejores asistentes de codificación que he encontrado es el AutoExperto. Es un GPT que está diseñado para ayudarle como asistente de programación de pares constantes.

El GPT está desarrollado con capacidad adicional de generación de código, acceso en línea a las API más recientes y comandos personalizados para guardar el estado de su sesión, que puede usar para la sesión posterior si es necesario.

El uso de este GPT le ayudará a generar el código complejo para cualquier propósito que necesite durante la actividad de ciencia de datos. También le proporciona la estructura del código y el script para ayudarle a ejecutarlos mejor.

Pasemos de la parte de codificación técnica y vayamos a la teórica. Como sabemos, los trabajos de ciencia de datos tratan del aprendizaje continuo, especialmente en casos de uso novedosos. Con la creciente investigación en ciencia de datos, a veces es difícil encontrar la investigación perfecta que pueda ayudar en nuestros casos de uso. Aquí es donde AcadémicoGPT entra en juego.

Este GPT le ayudará a encontrar los últimos trabajos de investigación para nuestros casos de uso. Desde un simple mensaje, nos daría una selección de los últimos artículos relacionados con el problema que queremos resolver.

Por ejemplo, el texto a continuación es el resultado de ScholarGPT, donde cargué nuestro conjunto de datos y les pedí que me proporcionaran un trabajo de investigación relacionado con la predicción de la deserción.

Título: “Transparencia en la toma de decisiones: el papel de la IA explicable (XAI) en el análisis de pérdida de clientes”

  • Autores: C ÖZKURT
  • Año: 2024
  • Resumen: Este estudio se centra en predecir la pérdida de clientes y explicar las razones detrás de ella utilizando el aprendizaje automático, analizando específicamente la pérdida de clientes en el sector de las telecomunicaciones a través de un análisis riguroso.
  • Enlace: Leer mas?¿fuente?.

ScholarGPT proporciona muchos más artículos de investigación entre los que puede elegir, para que pueda seleccionar cuál se aplica a sus casos de uso.

El próximo GPT que discutiríamos es el Diagrama caprichoso. Para muchas actividades de ciencia de datos, no siempre se trata de investigación y desarrollo de modelos. Son muchas las veces que necesitamos visualizar nuestro flujo de trabajo y dar una explicación de cómo sería nuestro trabajo. Aquí es donde Whimsical Diagrams GPT te ayudará.

Este GPT está diseñado para explicar y visualizar conceptos con diagramas de flujo, mapas mentales y diagramas de secuencia. Proporcionar la fuente de datos y indicaciones que tenemos podría ayudarnos a ofrecer una visualización que ayudaría en nuestro trabajo.

Por ejemplo, le pedí al modelo que me proporcionara un diagrama de sugerencias del conjunto de datos de abandono y me sugirió visualizar el abandono por características. A continuación se muestra el resultado de la imagen.

 

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos
Rotación por las características (Imagen generada por Whimsical Diagram GPT)
 

Puede seguir hablando con el GPT para encontrar el flujo de trabajo de diagrama perfecto para los trabajos de ciencia de datos.

El último es el CanvaGPT, lo que podría ayudarnos a comunicar nuestros resultados. Como sabemos, Canva es una plataforma de servicios que ayuda a diseñar de todo, desde logotipos hasta fotos de perfil, pancartas y presentaciones. Con Canva GPT, pueden ayudarnos a obtener el mejor diseño para nuestro análisis.

La ciencia de datos consiste en comunicar nuestros resultados a otros, por lo que es esencial tener resultados válidos que se presenten de manera que la audiencia los entienda. Con Canva GPT, podemos pedir sugerencias sobre qué diseño es el adecuado. Por ejemplo, le pedí al modelo que me proporcionara un diseño que fuera perfecto para presentar las estadísticas de abandono.

 

7 GPT para ayudar a mejorar su flujo de trabajo de ciencia de datos
Selección de diseño de estadísticas de abandono (Canva GPT)
 

El GPT nos daría las opciones de diseño y podríamos elegir cuál preferimos o dar indicaciones adicionales para obtener otros diseños.

Este artículo analiza siete GPT personalizados disponibles en la Tienda de GPT que podrían mejorar nuestro flujo de trabajo de ciencia de datos; ellos son:

  1. Analista de datos por ChatGPT
  2. Aprendizaje automático por Maryam Eskandari
  3. Ingeniero de aprendizaje automático de Hustle Playground
  4. AutoExpert (desarrollador) por llmimagineers.com
  5. ScholarGPT por awesomegpts.ai
  6. Diagramas caprichosos de whimsical.com
  7. Canva por canva.com

¡Espero que ayude! ¿Tiene alguna sugerencia de GPT que debería estar en esta lista? Déjalos en los comentarios también.
 
 

Cornelio Yudha Wijaya es subgerente de ciencia de datos y escritor de datos. Mientras trabaja a tiempo completo en Allianz Indonesia, le encanta compartir consejos sobre Python y datos a través de las redes sociales y los medios de escritura.

punto_img

Información más reciente

punto_img