Logotipo de Zephyrnet

Prompt Engineering 101: Dominar la comunicación eficaz del LLM – KDnuggets

Fecha:

Ingeniería rápida 101: dominar la comunicación eficaz de LLM
Imagen creada por el autor con DALL•E 3
 

La ingeniería rápida, al igual que los propios modelos lingüísticos, ha avanzado mucho en los últimos 12 meses. Hace solo poco más de un año que ChatGPT irrumpió en escena y arrojó los temores y esperanzas de todos sobre la IA en una olla a presión sobrealimentada, acelerando tanto las historias apocalípticas como las de salvación de la IA casi de la noche a la mañana. Ciertamente, la ingeniería rápida existía mucho antes de ChatGPT, pero la variedad de técnicas en constante cambio que utilizamos para obtener las respuestas deseadas de la gran cantidad de modelos de lenguaje que ahora invaden nuestras vidas realmente se ha vuelto realidad junto con el surgimiento de ChatGPT. Hace cinco años, con la presentación del GPT original, bromeamos acerca de cómo “ingeniero rápido” algún día podría convertirse en un título de trabajo; Hoy en día, los ingenieros rápidos son una de las carreras tecnológicas (o adyacentes a la tecnología) más populares que existen.

La ingeniería rápida es el proceso de estructurar un texto que puede ser interpretado y comprendido mediante un modelo de IA generativo. Un mensaje es un texto en lenguaje natural que describe la tarea que debe realizar una IA.

De la "Ingeniería rápida" Entrada de Wikipedia

Dejando a un lado las exageraciones, la ingeniería rápida es ahora una parte integral de las vidas de quienes interactúan con los LLM de forma regular. Si estás leyendo esto, es muy probable que esto describa Usted, o describe la dirección que puede estar tomando su carrera. Para aquellos que buscan tener una idea de qué es la ingeniería rápida y, lo que es más importante, cómo es el panorama actual de la estrategia rápida, este artículo es para ustedes.

Empecemos con lo básico. Este artículo, Ingeniería rápida para una interacción efectiva con ChatGPT, en Machine Learning Mastery cubre los conceptos fundamentales de ingeniería rápida. Específicamente, los temas introducidos incluyen:

  • Principios de la incitación, que describe varias técnicas fundamentales para recordar en el proceso de optimización inmediata.
  • Ingeniería Rápida Básica, como redacción rápida, concisión e indicaciones positivas y negativas
  • Estrategias avanzadas de ingeniería rápida, incluidas indicaciones únicas y múltiples, indicaciones de cadena de pensamiento, autocrítica e indicaciones iterativas.
  • Consejos de poder colaborativo por reconocer y fomentar una atmósfera de colaboración con ChatGPT para conducir a un mayor éxito

La ingeniería rápida es el aspecto más crucial para utilizar los LLM de manera efectiva y es una herramienta poderosa para personalizar las interacciones con ChatGPT. Implica elaborar instrucciones o consultas claras y específicas para obtener las respuestas deseadas del modelo de lenguaje. Al crear mensajes cuidadosamente, los usuarios pueden guiar el resultado de ChatGPT hacia los objetivos previstos y garantizar respuestas más precisas y útiles.

Del artículo de Dominio del aprendizaje automático “Ingeniería rápida para una interacción efectiva con ChatGPT"

Una vez que haya cubierto los conceptos básicos y tenga una idea de lo que es la ingeniería rápida y algunas de las técnicas actuales más útiles, puede pasar a dominar algunas de esas técnicas.

Los siguientes artículos de KDnuggets son cada uno de ellos una descripción general de una única técnica común de ingeniería rápida. Hay una progresión lógica en la complejidad de estas técnicas, por lo que comenzar desde arriba y trabajar hacia abajo sería el mejor enfoque.

Cada artículo contiene una descripción general del artículo académico en el que se propuso la técnica por primera vez. Puede leer la explicación de la técnica, ver cómo se relaciona con otras y encontrar ejemplos de su implementación, todo dentro del artículo, y si está interesado en leer o explorar el documento al que está vinculado también desde dentro.

 
Desentrañando el poder de la cadena de pensamiento en modelos de lenguaje grande

Este artículo profundiza en el concepto de estimulación de cadena de pensamiento (CoT), una técnica que mejora las capacidades de razonamiento de los modelos de lenguaje grandes (LLM). Analiza los principios detrás de las indicaciones de CoT, su aplicación y su impacto en el desempeño de los LLM.

 
Explorando el árbol de la estimulación del pensamiento: cómo la IA puede aprender a razonar mediante la búsqueda

El nuevo enfoque representa la resolución de problemas como una búsqueda de pasos de razonamiento para modelos de lenguaje grandes, lo que permite la exploración y planificación estratégicas más allá de la decodificación de izquierda a derecha. Esto mejora el desempeño en desafíos como acertijos matemáticos y escritura creativa, y mejora la interpretabilidad y aplicabilidad de los LLM.

 
Automatización de la cadena de pensamiento: cómo la IA puede incitarse a razonar

El método de indicaciones Auto-CoT hace que los LLM generen automáticamente sus propias demostraciones para impulsar un razonamiento complejo, utilizando muestreo basado en la diversidad y generación de disparo cero, lo que reduce el esfuerzo humano en la creación de indicaciones. Los experimentos muestran que iguala el rendimiento de las indicaciones manuales en todas las tareas de razonamiento.

 
Procesamiento paralelo en ingeniería rápida: la técnica del esqueleto del pensamiento

Explore cómo la técnica de ingeniería rápida Skeleton-of-Thought mejora la IA generativa al reducir la latencia, ofrecer resultados estructurados y optimizar proyectos.

 
Desbloqueo del resumen GPT-4 con indicaciones de cadena de densidad

Descubra el poder del resumen GPT-4 con Chain of Density (CoD), una técnica que intenta equilibrar la densidad de la información para obtener resúmenes de alta calidad.

 
Desbloquear generaciones confiables a través de la cadena de verificación: un salto en ingeniería rápida

Explore el método de ingeniería rápida de cadena de verificación, un paso importante hacia la reducción de las alucinaciones en modelos de lenguaje grandes, garantizando respuestas de IA confiables y objetivas.

 
Gráfico de pensamientos: un nuevo paradigma para la resolución elaborada de problemas en modelos de lenguaje grandes

Descubra cómo Graph of Thoughts pretende revolucionar la ingeniería rápida y los LLM en general, permitiendo una resolución de problemas más flexible y humana.

 
Propagación del pensamiento: un enfoque analógico del razonamiento complejo con modelos de lenguaje grandes

La propagación del pensamiento es una técnica de ingeniería rápida que instruye a los LLM a identificar y abordar una serie de problemas que son similares a la consulta original, y luego usar las soluciones a estos problemas similares para generar directamente una nueva respuesta o formular un plan de acción detallado que perfeccione la solución original.

Si bien lo anterior debería llevarlo a un punto donde puede comenzar a diseñar indicaciones efectivas, los siguientes recursos pueden brindarle profundidad adicional y/o vistas alternativas que pueden resultarle útiles.

 
Dominar la IA generativa y la ingeniería rápida: una guía práctica para científicos de datos [libro electrónico] Desde Horizontes de ciencia de datos

El libro electrónico proporciona una comprensión profunda de la IA generativa y la ingeniería rápida, y cubre conceptos clave, mejores prácticas y aplicaciones del mundo real. Obtendrá información sobre modelos de IA populares, aprenderá el proceso de diseño de indicaciones efectivas y explorará las consideraciones éticas que rodean estas tecnologías. Además, el libro incluye estudios de casos que demuestran aplicaciones prácticas en diferentes industrias.

 
Dominar las indicaciones de texto de IA generativa [libro electrónico] Desde Horizontes de ciencia de datos

Ya sea que sea un escritor que busca inspiración, un creador de contenido que busca la eficiencia, un educador apasionado por compartir conocimientos o un profesional que necesita aplicaciones especializadas, Mastering Generative AI Text Prompts es su recurso de referencia. Al final de esta guía, estará equipado para aprovechar el poder de la IA generativa, mejorando su creatividad, optimizando su flujo de trabajo y resolviendo una amplia gama de problemas.

 
La psicología de la ingeniería rápida [libro electrónico] Desde Horizontes de ciencia de datos

Nuestro libro electrónico está repleto de ideas cautivadoras y estrategias prácticas, que cubren una amplia gama de temas como la comprensión de la cognición humana y los modelos de IA, los principios psicológicos de las indicaciones efectivas, el diseño de indicaciones con principios cognitivos en mente, la evaluación y optimización de las indicaciones y la integración de principios psicológicos en su flujo de trabajo. También hemos incluido estudios de casos del mundo real de ejemplos exitosos de ingeniería rápida, así como una exploración del futuro de la ingeniería rápida, la psicología y el valor de la colaboración interdisciplinaria.

 
Guía rápida de ingeniería Desde DAIR.AI

La ingeniería de avisos es una disciplina relativamente nueva para desarrollar y optimizar avisos para utilizar eficientemente modelos de lenguaje (LM) para una amplia variedad de aplicaciones y temas de investigación. Las habilidades de ingeniería rápidas ayudan a comprender mejor las capacidades y limitaciones de los modelos de lenguajes grandes (LLM).

 
Guía rápida de ingeniería Desde Aprenda las indicaciones

La IA generativa es la palabra de moda más candente en el mundo y hemos creado la guía más completa (y gratuita) sobre cómo usarla. Este curso está diseñado para lectores no técnicos, que tal vez ni siquiera hayan oído hablar de la IA, lo que lo convierte en el punto de partida perfecto si es nuevo en la IA generativa y la ingeniería rápida. Los lectores técnicos encontrarán información valiosa en nuestros módulos posteriores.

La ingeniería rápida es una habilidad imprescindible tanto para los ingenieros de inteligencia artificial como para los usuarios avanzados de LLM. Más allá de esto, la ingeniería rápida se ha convertido en una carrera de nicho de IA por derecho propio. No se sabe cuál es la función exacta de la ingeniería rápida, o si los profesionales de la IA seguirán buscando roles de ingeniero rápido dedicados, pero una cosa está clara: el conocimiento de la ingeniería rápida nunca se le reprochará. Si sigue los pasos de este artículo, ahora debería tener una base sólida para diseñar sus propias indicaciones de alto rendimiento.

¿Quién sabe? Quizás seas el próximo susurrador de IA.
 
 

Mateo Mayo (@mattmayo13) tiene una maestría en informática y un diploma de posgrado en minería de datos. Como editor en jefe de KDnuggets, Matthew tiene como objetivo hacer accesibles conceptos complejos de ciencia de datos. Sus intereses profesionales incluyen el procesamiento del lenguaje natural, los algoritmos de aprendizaje automático y la exploración de la IA emergente. Lo impulsa la misión de democratizar el conocimiento en la comunidad de ciencia de datos. Matthew ha estado codificando desde que tenía 6 años.

punto_img

Información más reciente

punto_img