Logotipo de Zephyrnet

Ingeniería rápida: la guía definitiva para liberar el poder de ChatGPT y otros modelos de lenguaje – TechStartups

Fecha:

ChatGPT ha provocado una revolución creativa en inteligencia artificial (IA) que es verdaderamente innovadora. En sólo un año, este modelo de lenguaje ha impresionado a los expertos con sus habilidades de escritura, su hábil manejo de tareas complejas y su interfaz sorprendentemente fácil de usar. Sin embargo, hay más debajo de la superficie. ChatGPT ha provocado una oleada de creatividad, permitiendo a las personas producir contenido que antes se consideraba inimaginable.

Las posibilidades con ChatGPT y modelos de lenguaje similares (LM) son prácticamente ilimitadas. La clave reside en un factor crucial: elaborar el conjunto perfecto de instrucciones de entrada, llamadas indicaciones, que liberen su verdadero potencial en un amplio espectro de tareas. Piense en ello como el lenguaje secreto que aprovecha la brillantez interior de la IA y la guía para realizar milagros con palabras. Esta idea de elaborar mensajes para obtener resultados óptimos condujo a un nuevo campo conocido como Ingeniería Rápida.

¿Qué es la ingeniería rápida?

La ingeniería de avisos es la práctica de diseñar o elaborar hábilmente entradas (conocidas como avisos) para modelos de lenguaje de IA generativos como GPT-3, GPT-4 y modelos de lenguaje grandes similares para producir resultados óptimos.

Se puede considerar que le da a la IA la receta perfecta para el éxito. Usted proporciona los ingredientes (el mensaje) y la IA cocina (genera el resultado). El objetivo es dar forma cuidadosamente a las indicaciones para lograr los mejores resultados posibles a partir de estos sofisticados modelos de lenguaje.

Al igual que mejoramos con la práctica, la ingeniería de indicaciones consiste en experimentar con la redacción, la estructura y el formato de las indicaciones. Este ajuste influye en el comportamiento del modelo y ayuda a generar respuestas que son específicas y contextualmente relevantes.

Si bien la inteligencia artificial existe desde finales de los años cincuenta y principios de los sesenta, la ingeniería rápida es un campo relativamente reciente y en evolución. Adquirir habilidades en ingeniería rápida es esencial para comprender las fortalezas y limitaciones de los modelos de lenguaje grandes (LLM).

La ingeniería rápida resulta particularmente valiosa en aplicaciones que requieren ajustes o personalización del comportamiento del modelo. Los usuarios pueden experimentar y perfeccionar las indicaciones basadas en las respuestas del modelo para lograr los resultados deseados. La eficacia de las indicaciones varía según el modelo específico que se utilice. Los investigadores y profesionales a menudo participan en pruebas y errores y experimentaciones para identificar las indicaciones óptimas para diferentes tareas o aplicaciones.

Comprensión de la ingeniería rápida:

Imagine ChatGPT como un motor potente que espera la combinación adecuada de combustible y dirección para funcionar con su máxima eficiencia. En esta analogía, el mensaje funciona como combustible y brújula, proporcionando las instrucciones necesarias para que ChatGPT ejecute una tarea. Ya sea que se trate de una pregunta sencilla, un mensaje formulado de forma creativa o un conjunto multifacético de pautas, el mensaje prepara el escenario para el desempeño de la IA.

Por ejemplo, los investigadores utilizan la ingeniería rápida para mejorar las capacidades de los LLM en diversas tareas comunes y complejas, como la respuesta a preguntas y el razonamiento aritmético. Los desarrolladores emplean ingeniería rápida para crear técnicas sólidas y efectivas para interactuar con LLM y otras herramientas.

Sin embargo, la ingeniería de avisos va más allá de la simple creación de avisos. Abarca un conjunto diverso de habilidades y técnicas útiles para interactuar y desarrollar LLM. Es una habilidad fundamental para interactuar, desarrollar y comprender las capacidades de los LLM. La ingeniería rápida puede contribuir a mejorar la seguridad de los LLM e introducir nuevas capacidades, como aumentar los LLM con conocimiento del dominio y herramientas externas.

Cómo facilitar la ingeniería rápida:

  1. Especificidad: La precisión de su mensaje se correlaciona directamente con la especificidad de la respuesta de la IA. Ajustar la redacción, incorporar el contexto y ofrecer ejemplos sirven como herramientas de navegación, lo que lleva a ChatGPT hacia un resultado más enfocado y personalizado.
  2. Controlar: La elaboración del mensaje le permite influir en el estilo, el tono y el formato del contenido generado por IA. Ya sea que busque una pieza poética o un resumen fáctico, el mensaje sirve como directiva y moldea el resultado de acuerdo con sus preferencias.
  3. Creatividad: La ingeniería rápida desbloquea la capacidad de ChatGPT para generar diversos formatos creativos, que abarcan poemas, códigos, guiones, composiciones musicales, correos electrónicos y cartas. Cuanto más matizada y detallada sea la indicación, más creativo y variado será el resultado de la IA.
  4. Eficiencia: Al invertir tiempo en perfeccionar su mensaje, puede ahorrar mucho esfuerzo y tiempo en comparación con experimentar con varios enfoques de forma iterativa. Un mensaje bien elaborado agiliza la comprensión de la IA, lo que da como resultado respuestas más eficientes y precisas.

Ejemplos ilustrativos:

  • Aviso sencillo: "Escribe un poema sobre un robot que se enamora de un humano".
  • Aviso específico: “Componga un soneto en pentámetro yámbico, explorando temas de soledad y aislamiento en un entorno ciberpunk futurista”.
  • Mensaje de instrucción: "Genere un guión para una breve comedia entre dos trabajadores de oficina, centrándose en lo absurdo de la jerga corporativa".

Beneficios de la ingeniería rápida:

  • Desbloquear todo el potencial: Dirija ChatGPT para cumplir sus objetivos específicos, en lugar de depender de su interpretación.
  • Impulse la productividad: Ahorre tiempo y esfuerzo formulando un mensaje bien definido desde el principio.
  • Mejora la creatividad: La ingeniería rápida facilita la creación de contenido original y único en varios formatos.
  • Mejorar la comunicacion: Interactúe de manera más efectiva con ChatGPT para lograr los resultados deseados.

Primeros pasos con la ingeniería rápida:

  • Explore ejemplos y tutoriales: Familiarícese con estrategias rápidas exitosas en línea.
  • Experimento: Pruebe diferentes indicaciones para descubrir cuál produce los mejores resultados.
  • Abraza la creatividad: No dudes en inyectar creatividad en tus indicaciones.

En esencia, dominar el arte de la ingeniería rápida permite a los usuarios liberar el potencial de ChatGPT, transformándolo en una herramienta valiosa para una variedad de tareas, que van desde la escritura creativa y la recopilación de información hasta simplemente disfrutar de interacciones interesantes con la IA.

Para sumergirse en el mundo de la ingeniería rápida, OpenAI ha lanzado un conjunto de guías que ofrecen estrategias y tácticas para mejorar el rendimiento de modelos de lenguaje grandes, incluidos modelos como GPT-4. La Guía de ingeniería rápida de OpenAI establece métodos que a veces se pueden combinar para obtener un resultado aún más impactante, y OpenAI anima a los usuarios a experimentar y descubrir los enfoques que mejor se adapten a sus necesidades.

Vale la pena señalar que algunos de los ejemplos de la Guía de ingeniería de OpenAI funcionan actualmente exclusivamente con su modelo más avanzado, GPT-4. En general, si se encuentra con una situación en la que un modelo no cumple con una tarea, OpenAI recomienda que pruebe con un modelo más avanzado.

Estrategias y tácticas de ingeniería rápidas

A continuación se presentan seis estrategias recomendadas por OpenAI para obtener mejores resultados con sus indicaciones.

Seis estrategias para obtener mejores resultados

Escribe instrucciones claras

Estos modelos no pueden leer tu mente. Si los resultados son demasiado largos, solicite respuestas breves. Si los resultados son demasiado simples, solicite redacción a nivel de experto. Si no le gusta el formato, demuestre el formato que le gustaría ver. Cuanto menos tenga que adivinar el modelo lo que quieres, más probabilidades tendrás de conseguirlo.

Táctica:

Proporcionar texto de referencia

Los modelos de lenguaje pueden inventar con confianza respuestas falsas, especialmente cuando se les pregunta sobre temas esotéricos o citas y URL. De la misma manera que una hoja de notas puede ayudar a un estudiante a obtener mejores resultados en un examen, proporcionar un texto de referencia a estos modelos puede ayudar a responder con menos mentiras.

Táctica:

Divida tareas complejas en subtareas más simples

Así como es una buena práctica en ingeniería de software descomponer un sistema complejo en un conjunto de componentes modulares, lo mismo ocurre con las tareas sometidas a un modelo de lenguaje. Las tareas complejas tienden a tener tasas de error más altas que las tareas más simples. Además, las tareas complejas a menudo pueden redefinirse como un flujo de trabajo de tareas más simples en el que los resultados de tareas anteriores se utilizan para construir las entradas de tareas posteriores.

Táctica:

Dale tiempo al modelo para "pensar"

Si te piden que multipliques 17 por 28, es posible que no lo sepas al instante, pero aun así podrás resolverlo con el tiempo. De manera similar, los modelos cometen más errores de razonamiento cuando intentan responder de inmediato, en lugar de tomarse el tiempo para encontrar una respuesta. Solicitar una “cadena de pensamiento” antes de una respuesta puede ayudar al modelo a razonar hacia respuestas correctas de manera más confiable.

Táctica:

Utilice herramientas externas

Compensar las debilidades del modelo alimentándolo con los resultados de otras herramientas. Por ejemplo, un sistema de recuperación de texto (a veces llamado RAG o recuperación de generación aumentada) puede informar al modelo sobre documentos relevantes. Un motor de ejecución de código como Code Interpreter de OpenAI puede ayudar al modelo a hacer cálculos y ejecutar código. Si una tarea se puede realizar de manera más confiable o eficiente mediante una herramienta que mediante un modelo de lenguaje, descárguela para obtener lo mejor de ambos.

Táctica:

La prueba cambia sistemáticamente.

Mejorar el rendimiento es más fácil si puedes medirlo. En algunos casos, una modificación de un mensaje logrará un mejor rendimiento en unos pocos ejemplos aislados, pero conducirá a un peor rendimiento general en un conjunto de ejemplos más representativo. Por lo tanto, para estar seguro de que un cambio es netamente positivo para el rendimiento, puede ser necesario definir un conjunto de pruebas integral (también conocido como “evaluación”).

Táctica:

Táctica

Cada una de las estrategias enumeradas anteriormente se puede implementar con tácticas específicas. Estas tácticas están destinadas a proporcionar ideas sobre cosas que se pueden probar. De ninguna manera son completamente completos y usted debe sentirse libre de probar ideas creativas que no están representadas aquí.

Estrategia: escribir instrucciones claras 

Táctica: incluya detalles en su consulta para obtener respuestas más relevantes

Para obtener una respuesta muy relevante, asegúrese de que las solicitudes proporcionen detalles o contexto importantes. De lo contrario, dejarás que el modelo adivine lo que quieres decir.

Peor mejores
¿Cómo sumo números en Excel? ¿Cómo sumo una fila de montos en dólares en Excel? Quiero hacer esto automáticamente para una hoja completa de filas con todos los totales terminando a la derecha en una columna llamada "Total".
¿Quién es el presidente? ¿Quién fue presidente de México en 2021 y con qué frecuencia se celebran elecciones?
Escribe código para calcular la secuencia de Fibonacci. Escriba una función de TypeScript para calcular eficientemente la secuencia de Fibonacci. Comente el código generosamente para explicar qué hace cada pieza y por qué está escrita de esa manera.
Resuma las notas de la reunión. Resume las notas de la reunión en un solo párrafo. Luego, escriba una lista rebajada de los oradores y cada uno de sus puntos clave. Finalmente, enumere los próximos pasos o acciones sugeridas por los oradores, si las hubiera.

Ejemplos de ingeniería rápida:

Táctica: pedirle al modelo que adopte una personalidad.

TEl mensaje del sistema se puede utilizar para especificar la persona utilizada por el modelo en sus respuestas.

SISTEMA: Cuando te pido ayuda para escribir algo, me responderás con un documento que contenga al menos un chiste o un comentario divertido en cada párrafo.

USUARIO: Escriba una nota de agradecimiento a mi proveedor de pernos de acero por realizar la entrega a tiempo y con poca antelación. Esto nos permitió entregar un pedido importante.

Abierto en el patio de juegos

Táctica: utilice delimitadores para indicar claramente distintas partes de la entrada

Los delimitadores como comillas triples, etiquetas XML, títulos de sección, etc. pueden ayudar a demarcar secciones de texto que se tratarán de manera diferente.

USUARIO: Resume el texto delimitado por comillas triples con un haiku. “””insertar texto aquí”””

Abierto en el patio de juegos

Puede leer el resto de los ejemplos de ingeniería en OpenAI.com

A continuación se muestra un rápido tutorial de ingeniería de Anu Kubo sobre cómo obtener ChatGPT y modelos de lenguajes grandes (LLM) para brindarle respuestas perfectas.

[Contenido incrustado]


punto_img

Información más reciente

punto_img