Logotipo de Zephyrnet

ChatGPT encuentra un rol jugando a Dungeons & Dragons

Fecha:

Boffins ha encontrado un papel para los chatbots de IA donde la alucinación habitual no es necesariamente una responsabilidad.

Los intelectuales, con sede en la Universidad de Pensilvania y la Universidad de Maryland, condado de Baltimore, en los EE. UU., reclutaron los modelos de lenguaje grande (LLM) de OpenAI para ayudar con los juegos de rol de fantasía, específicamente Dungeons & Dragons (D&D).

En un papel de preimpresión titulado “CALYPSO: LLM como asistentes de Dungeon Masters”, Andrew Zhu, estudiante de doctorado de UPenn; Lara Martin, profesora asistente de la UMBC; Andrew Head, profesor asistente en UPenn; y Chris Callison-Burch, profesor asociado de UPenn, explican cómo utilizaron los LLM para mejorar un juego que depende en gran medida de la interacción humana.

D&D apareció por primera vez en 1974 como un juego de rol (RPG) en el que los jugadores asumían los roles de héroes medievales aventureros y representaban esas personalidades bajo una historia dirigida por un dungeon master (DM) o game master (GM). Los requisitos previos eran un conjunto de reglas, publicadas en ese momento por Reglas de estudios tácticos: dados poliédricos, lápiz, papel y un compromiso compartido con la narración interactiva y la teatralidad modesta. Se deben asumir refrigerios, técnicamente opcionales.

Junto con estos juegos de rol de mesa, la proliferación de computadoras personales en la década de 1980 condujo a varias versiones computarizadas, tanto en términos de juego asistido por computadora como de simulaciones completamente electrónicas, como la recientemente lanzada. Baldur’s Gate 3, por nombrar solo uno de los cientos de títulos inspirados en D&D y otros juegos de rol.

Los jugadores académicos de UPenn y UMBC se dispusieron a ver cómo los LLM podrían apoyar a los DM humanos, quienes son responsables de establecer el escenario donde tiene lugar la aventura imaginada mutuamente, de tirar los dados que determinan los resultados de ciertas acciones, de hacer cumplir las reglas ( que se han hecho bastante extensos), y por conseguir en general que la experiencia sea divertida y entretenida.

Para hacerlo, crearon un conjunto de tres interfaces impulsadas por LLM, llamado CALYPSO, que significa Asistente Colaborativo para Objetivos de Síntesis de Lore y Yielding Plot. Está diseñado para jugar D&D en línea a través de Discord, el popular servicio de chat.

“Cuando se les dio acceso a CALYPSO, los DM informaron que generó texto de alta fidelidad adecuado para la presentación directa a los jugadores e ideas de baja fidelidad que el DM podría desarrollar más mientras mantenía su agencia creativa”, explica el documento. “Vemos a CALYPSO como un ejemplo de un paradigma de herramientas aumentadas por IA que brindan asistencia creativa sincrónica dentro de los mundos de juegos establecidos y los juegos de mesa en general”.

La pandemia de COVID-19 cambió algunos juegos de mesa en persona en línea, observan los investigadores en su artículo, y muchos jugadores que juegan a través de Discord lo hacen con avrae – un bot de Discord diseñado por Andrew Zhu, estudiante de doctorado de UPenn y coautor del artículo CALYPSO.

“Las ideas centrales del documento (que los LLM son capaces de actuar como co-DM de manera que ayuden a inspirar al DM humano sin asumir el control creativo del juego) se aplican a D&D y otros juegos de mesa, independientemente de la modalidad. Pero todavía hay algunos desafíos que superar antes de aplicar la tecnología a los juegos en persona”, dijo Zhu en un correo electrónico a El registro.

Zhu y sus colegas se centraron en los juegos Play-by-post (PBP) de Discord por varias razones. Primero, "PBP basado en Discord ya está basado en texto, por lo que no tenemos que perder tiempo transcribiendo el habla en texto para un LLM", explicó.

La configuración en línea también permite que el DM vea la salida generada por LLM en privado (donde las "ideas de baja fidelidad" importan menos) y libera al DM de tener que escribir o dictar en alguna interfaz.

CALYPSO, un Bot de Discord con código fuente, se describe en el documento con tres interfaces: una para generar el texto de configuración que describe un encuentro (GPT-3); uno para lluvia de ideas enfocada, en el que el DM puede pedirle al LLM preguntas sobre un encuentro o refinar un resumen de encuentro (ChatGPT); y uno para el chat de dominio abierto, en el que los jugadores pueden interactuar directamente con ChatGPT actuando como una criatura de fantasía con conocimientos sobre D&D.

Imagen de la salida del bot CALYPSO

Imagen de la salida del bot CALYPSO (haga clic para ampliar)

La configuración de estas interfaces implicó sembrar el LLM con indicaciones específicas (detalladas en el documento) que explican cómo debe responder el chatbot en cada rol de interfaz. No se requirió un entrenamiento de modelo específico para incorporar cómo funciona D&D.

"Descubrimos que incluso sin capacitación, la serie de modelos GPT sabe mucho sobre D&D al haber visto libros de referencia y discusiones en Internet en sus datos de capacitación", dijo Zhu.

Descubrimos que incluso sin capacitación, la serie de modelos GPT sabe mucho sobre D&D por haber visto libros fuente y discusiones en Internet.

Zhu y sus colegas probaron CALYPSO con 71 jugadores y DM, luego los encuestaron sobre la experiencia. Encontraron que el asistente de IA era útil la mayoría de las veces.

Pero había espacio para mejorar. Por ejemplo, en un encuentro, CALYPSO simplemente parafraseó la información en el indicador de configuración y estadísticas, que los DM sintieron que no agregaba valor.

El registro preguntó a Zhu si la tendencia de los LLM a "alucinar" (inventar cosas) era un problema para los participantes del estudio.

“En un contexto creativo, se vuelve un poco menos significativo; por ejemplo, los libros de referencia de D&D no contienen todos los detalles sobre cada monstruo, por lo que si un LLM afirma que cierto monstruo tiene un pelaje de cierto color, ¿eso cuenta como una alucinación? ?” dijo Zhu.

“Para responder a la pregunta directamente, sí; el modelo a menudo 'inventa' hechos sobre monstruos que no están en los libros de origen. La mayoría de estas son cosas triviales que realmente ayudan al DM, como cómo suena la llamada de un monstruo o la forma del iris de un monstruo o cosas así. A veces, con menos frecuencia, alucina hechos más drásticos, como decir que las salamandras heladas tienen alas (no las tienen)”.

Otro problema que surgió fue que las salvaguardas de entrenamiento del modelo a veces interferían con la capacidad de CALYPSO para discutir temas que serían apropiados en un juego de D&D, como la raza y el juego.

“Por ejemplo, el modelo a veces se niega a sugerir razas (de fantasía), probablemente debido a los esfuerzos para reducir el potencial de sesgo racial en el mundo real”, observa el documento. "En otro caso, el modelo insiste en que es incapaz de jugar D&D, probablemente debido a los esfuerzos para evitar que el modelo afirme tener habilidades que no posee".

(Sí, estamos seguros de que algunos de nosotros hemos estado allí antes, negando cualquier conocimiento de los juegos de rol a pesar de los años de juego).

Zhu dijo que está claro que la gente no quiere un DM de IA, pero están más dispuestos a permitir que los DM se apoyen en la ayuda de la IA.

“Durante nuestros estudios formativos, un tema común era que las personas no querían un DM de IA autónomo, por un par de razones”, explicó. “Primero, muchos de los jugadores que entrevistamos ya habían jugado con herramientas como AI Dungeon y estaban familiarizados con las debilidades de AI en la narración de contexto largo. En segundo lugar, y más importante, expresaron que tener un DM de IA autónomo le quitaría el espíritu del juego; dado que D&D es un juego creativo de narración de historias, tener una IA que genere esa historia se sentiría mal.

“Tener CALYPSO como algo opcional que los DM podían elegir usar tanto o tan poco como quisieran ayudó a mantener la pelota creativa en la cancha del DM humano; a menudo, lo que sucedería es que CALYPSO le daría al DM el empujón suficiente para sacarlo de la rutina del bloqueo del escritor o simplemente le daría una lista de ideas para construir. Una vez que el DM humano sintió que quería tener más control sobre la escena, podía continuar DMing a su propio estilo sin usar CALYPSO en absoluto”. ®

punto_img

Información más reciente

punto_img