Microsoft presenta el marco de optimización automática de avisos para los LLM

Microsoft AI Research ha introducido recientemente un nuevo marco llamado Optimización automática de avisos (APO) para mejorar significativamente el rendimiento de grandes modelos de lenguaje (LLM). Este marco está diseñado para ayudar a los usuarios a crear mejores avisos con una mínima intervención manual y optimizar pronta ingenieria para mejores resultados. En este artículo, nos sumergimos en los detalles de APO y su impacto potencial en las tareas de NLP. Primero, comencemos con su definición.

Microsoft AI Research presenta APO, un marco simple y de propósito general para la optimización automática de las indicaciones de LLM que reduce significativamente los esfuerzos de indicación manual.

¿Qué es APO?

APO es un marco simple y de propósito general que optimiza automáticamente las solicitudes para los LLM. Es un algoritmo de optimización rápida no paramétrico inspirado en el descenso de gradiente numérico. El algoritmo conecta dos enfoques automatizados existentes para ayudar a los humanos a escribir mejores indicaciones. Primero está el entrenamiento de modelos auxiliares o representaciones diferenciables del mensaje. El segundo es la aplicación de manipulaciones discretas a las indicaciones a través del aprendizaje por refuerzo (RL) o la retroalimentación basada en LLM.

¿Cómo funciona APO?

El enfoque propuesto primero adopta mini-lotes de datos de entrenamiento para obtener los "gradientes" en lenguaje natural, que describen las fallas de un aviso dado. Luego, edita el aviso hacia la dirección semántica opuesta del degradado. Estos pasos sirven como el componente de expansión de una búsqueda de haz más amplia en el espacio de indicaciones, lo que convierte la tarea en un problema de selección de candidatos de haz, mejorando así la eficiencia algorítmica.

Resultados y Evaluación

Para evaluar la efectividad de APO, el equipo de investigación de Microsoft lo comparó con tres líneas base de aprendizaje rápido de última generación. Se compararon en varias tareas de PNL, incluida la detección de jailbreak, detección de discursos de odio, detección de noticias falsas y detección de sarcasmo. Los resultados mostraron que APO superó constantemente a otras líneas de base, logrando mejoras significativas sobre las líneas de base de Monte Carlo (MC) y aprendizaje por refuerzo (RL) sin ajuste de hiperparámetros o entrenamiento de modelos.

Los resultados mostraron que APO superó consistentemente a otras líneas de base sin ajuste de hiperparámetros.

Impacto de APO

Con APO, optimizar y mejorar la ingeniería de indicaciones será más accesible y eficiente a medida que las indicaciones se vuelvan cada vez más complejas y sofisticadas. APO tiene el potencial de aumentar la eficiencia de los modelos de lenguaje grande y disminuir el trabajo manual y el tiempo de desarrollo necesarios para un desarrollo rápido al automatizar el proceso de optimización rápida. Este es un avance significativo, ya que puede resultar en un mejor desempeño en una variedad de tareas de PNL.

Lea también TCS planea una solución de inteligencia artificial similar a GPT para la codificación, allanando el camino para los ingenieros rápidos

Nuestro dicho

La introducción de la optimización automática de avisos (APO) por parte de Microsoft AI Research tendrá un impacto considerable en la optimización de la ingeniería de avisos para los LLM. El marco es simple de usar, de propósito general y no paramétrico. Esto lo convierte en una herramienta eficaz para mejorar la calidad de las solicitudes sin ajuste adicional de hiperparámetros o entrenamiento de modelos. Con APO, la optimización de la ingeniería rápida será más accesible, eficiente y precisa, lo que conducirá a mejores resultados en varias tareas de NLP.

Relacionado:

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoAiStream. Inteligencia de datos Web3. Conocimiento amplificado. Accede Aquí.
Acuñando el futuro con Adryenn Ashley. Accede Aquí.
Compra y Vende Acciones en Empresas PRE-IPO con PREIPO®. Accede Aquí.
Fuente: https://www.analyticsvidhya.com/blog/2023/05/microsoft-introduces-automatic-prompt-optimization-framework-for-llms/

Inteligencia de datos generativa

Microsoft presenta el marco de optimización de solicitud automática para LLM

¿Qué es APO?

¿Cómo funciona APO?

Resultados y Evaluación

Impacto de APO

Nuestro dicho

Relacionado:

“El gobierno de Estados Unidos no puede ir a la quiebra porque podemos imprimir nuestro propio dinero”, dice la Administración Biden

Las startups de criptomonedas recibieron 935 millones de dólares de fondos de capital de riesgo en abril

Información más reciente

Helldivers 2 golpeado por una ola de críticas negativas en Steam después del anuncio de PSN – PlayStation LifeStyle

Halo Infinite obtendrá su propia versión de Helldivers 2 gracias a los creadores de Forge

Cage The Elephant revela su último tema “Metaverse” – CryptoInfoNet

FC 24 TOTS Leroy Sane SBC, costos y soluciones

El crecimiento del empleo en EE.UU. se desacelera a medida que el precio de Bitcoin supera los 62,000 dólares

Redfall supera el primer aniversario, los héroes DLC prometidos aún no están a la vista