Imagen del autor
En este blog, exploraremos cinco proyectos esenciales de ciencia de datos que pueden impulsar los perfiles laborales tanto de estudiantes de último año como de profesionales. A través de estos proyectos, obtendrá una comprensión más profunda de los flujos de trabajo de la ciencia de datos y dominará las herramientas esenciales para la limpieza, manipulación, visualización y modelado de datos. Además, aprenderá a escribir informes de proyectos e implementar modelos de aprendizaje automático en la nube para lograr el máximo impacto.
En Energía reciclada ahorrada en Singapur proyecto, analizará cuánto Singapur está ahorrando energía por año al reciclar plásticos, papel, vidrio y metales ferrosos y no ferrosos. El proyecto implica la unión de datos, la limpieza de datos y la disputa de datos. Después de eso, realizará un análisis profundo de datos con herramientas estadísticas y de visualización.
Imagen del Proyecto
Al final, utilizará técnicas de manipulación de datos para encontrar la respuesta a la pregunta original: energía total ahorrada desde 2003 hasta 2020 según cinco tipos de desechos en Singapur.
Pronóstico de series temporales con statsmodels y Prophet El proyecto le enseñará habilidades esenciales para manejar datos de series temporales, realizar análisis de datos y pronósticos.
Imagen del Proyecto
Comenzará entrenando datos en el ARIMA modelo de pronóstico y realizar una evaluación del modelo. Después de eso, realizará pronósticos de series de tiempo con el paquete Python Profeta.
En Análisis de currículum spaCy proyecto, utilizará spaCy para el reconocimiento de entidades en 200 Resume y varias herramientas NLP para el análisis de texto. El objetivo del proyecto es ayudar a los reclutadores a tomar decisiones rápidas y precisas sobre miles de solicitudes de empleo.
Imagen del Proyecto
Comenzará cargando el conjunto de datos descartado y el modelo base spaCy para los idiomas inglés. A continuación, creará una regla de entidad y limpiará el conjunto de datos. Después de eso, realizará la visualización de datos, el reconocimiento de entidades y el análisis de dependencias. Al final, creará una función para reanudar la puntuación coincidente y realizar el modelado de temas.
La Análisis de datos de Tripadvisor El proyecto de cartera cubre todos los aspectos de la ciencia de datos, desde la carga de datos hasta el modelado de datos. Analizará las reseñas y calificaciones en función de la experiencia del cliente.
Imagen del Proyecto
En este proyecto realizarás:
- Exploración de datos
- Análisis de sentimiento usando Vader
- Visualización de datos
- Adición de palabras clave (Gensim)
- Procesamiento de texto (NLTK)
- Creación de un modelo de aprendizaje profundo (BiLSTM) con Keras
- Entrenamiento y Validación
- Evaluación del modelo
- Predicción
- Guardar modelo
Es una introducción a la clasificación de textos utilizando modelos de aprendizaje profundo. Antes de pasar a la capacitación, preprocesará los datos (lematización de texto), realizará un análisis de datos y preparará los datos (tokenización) para un modelo de aprendizaje profundo.
La Proyecto de aprobación de préstamo de extremo a extremo con ChatGPT es mi favorito. Aprenderá a dominar las indicaciones de GPT para todos los pasos involucrados en un proyecto de ciencia de datos de la vida real. En el proyecto, le pedirá a ChatGPT que lo ayude a crear un proyecto de aprobación de préstamo de extremo a extremo utilizando los datos que se extrajeron de LendingClub.com.
Imagen de Clasificador de préstamos
Aprenderá a escribir indicaciones para generar ideas, análisis de datos, ingeniería de características, preprocesar y equilibrar los datos, selección de modelos, ajuste y evaluación de modelos, crear una aplicación e implementarla en un servidor.
Estamos en la etapa en la que las empresas comenzarán a pedirles a los empleados que aprendan habilidades de promoción y mejoren el uso de las nuevas herramientas de IA. La ingeniería rápida se convertirá en una habilidad esencial para los científicos de datos, y el reclutador solicitará experiencia en el uso de GPT para tareas de ciencia de datos.
Entonces, ¿por qué esperar? Comience a usar GPT-4 y otras herramientas de IA para ser productivo y prepararse para el futuro.
Incluso si no tienes experiencia, estos proyectos te ayudarán a conseguir el trabajo de tus sueños. Después de trabajar en el proyecto, le recomiendo que los comparta en GitHub, DagsHub, Deepnote o Kaggle. Estas plataformas son utilizadas por desarrolladores y científicos de datos para mostrar sus proyectos y habilidades.
En esta publicación, hemos revisado 5 proyectos avanzados que cubren análisis de datos, series temporales, procesamiento de lenguaje natural, aprendizaje automático e ingeniería rápida usando ChatGPT. Si está interesado en conocer proyectos relacionados con campos específicos de la ciencia de datos, consulte la colección completa de proyectos de ciencia de datos: Parte 1 y Parte 2.
Espero que la lista de proyectos avanzados te ayude, avísame si tienes mejores sugerencias.
Abid Ali Awan (@ 1abidaliawan) es un profesional científico de datos certificado al que le encanta crear modelos de aprendizaje automático. Actualmente, se está enfocando en la creación de contenido y escribiendo blogs técnicos sobre aprendizaje automático y tecnologías de ciencia de datos. Abid tiene una Maestría en Gestión de Tecnología y una licenciatura en Ingeniería de Telecomunicaciones. Su visión es construir un producto de IA utilizando una red neuronal gráfica para estudiantes que luchan contra enfermedades mentales.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. Accede Aquí.
- Fuente: https://www.kdnuggets.com/2023/03/5-advance-projects-data-science-portfolio.html?utm_source=rss&utm_medium=rss&utm_campaign=5-advance-projects-for-data-science-portfolio