Logotipo de Zephyrnet

Más allá de la prueba de Turing

Fecha:

Más allá de la prueba de Turing

Con más avances en la inteligencia artificial, podría ser el momento de reemplazar la antigua Prueba de Turing con algo mejor para determinar si una máquina está pensando. Específicamente, un enfoque más moderno podría incluir preguntas estándar diseñadas para sondear varias facetas de la inteligencia y comparar la computadora con un espectro de encuestados humanos de diferentes edades, sexos, antecedentes y habilidades.


By Charles Simon, Emprendedor y desarrollador de software reconocido a nivel nacional.

Imagen de Juan Alberto Sánchez Margallo, CC POR 2.5.

Con la inteligencia artificial (IA) aparentemente tocando todos los aspectos de nuestras vidas, la mayoría de los expertos están de acuerdo en que es solo cuestión de tiempo antes de que la IA de hoy evolucione hacia la Inteligencia General Artificial (AGI), un punto en el que las computadoras cumplen o incluso superan la inteligencia humana. La pregunta que queda, sin embargo, es ¿cómo sabremos cuando eso suceda?

En 1950, Alan Turing introdujo su famosa prueba como método para determinar si una máquina realmente estaba pensando o no. Si bien su prueba ha experimentado cierta evolución desde su artículo original, una explicación común es la siguiente:

Una persona, el interrogador (C), puede comunicarse a través de una terminal de computadora (en estos días, podríamos decir mediante mensajería instantánea, correo electrónico o mensajes de texto). En el otro extremo del enlace de la computadora hay un humano (B) o una computadora (A). Después de 20 minutos de comunicación con el teclado, el interrogador indica si había una persona o una computadora en el otro extremo. Si el interrogador cree que estaba conversando con un humano, pero en realidad es una computadora, la conclusión es que la computadora debe estar pensando como un humano. Este experimento se lleva a cabo varias veces, con más de la mitad de los interrogadores de acuerdo, para que una computadora "pase" la prueba.

Una adaptación más reciente de la prueba de Turing reduce la conversación a cinco minutos y considera que la prueba se aprobó si la computadora engaña al sujeto más del 30% del tiempo. En 2014, un programa llamado Cleverbot (http://www.cleverbot.com/) se afirmó que pasó la prueba de Turing engañando al 33% de los interrogadores. Si bien Cleverbot tiene algunas respuestas sofisticadas, mi interacción con él rápidamente expuso sus limitaciones. Sin embargo, en lugar de objetar las afirmaciones de Cleverbot, preferiría objetar la prueba de Turing. Si bien representó un gran salto en el momento de su publicación, tengo dos preocupaciones principales:

  • El renombre de Turing Test impulsa el desarrollo de programas como Cleverbot o Watson, que tienen asombrosas habilidades lingüísticas a expensas de recursos destinados a AGI real.
  • Para pasar la prueba, una computadora debe estar programada para mentir. Cualquier pregunta personal como "¿Cuántos años tienes?", "¿De qué color son tus ojos?" O incluso "¿Eres una computadora?" son obsequios si la computadora responde con sinceridad. En la medida en que un sistema esté programado con el equivalente de metas y emociones para pasar la prueba, estas deben ser metas y emociones humanas en lugar de aquellas que podrían ser efectivas para la máquina. ¡Eso es un gran esfuerzo de desarrollo invertido solo para jugar lo que es esencialmente un juego de fiesta!

También me preocupa la precisión de la prueba:

  • La calidad del resultado de la prueba se basa en la sofisticación / credulidad del interrogador.
  • La prueba permite fingir deficiencias por parte de la computadora para cubrir sus limitaciones (por ejemplo, afirmar ser un niño para cubrir lagunas en su comprensión).
  • Impone limitaciones a nivel humano. Si pudiéramos construir una máquina con un intelecto sobrehumano, ¿fallaría la prueba porque parecía demasiado inteligente?

Supongamos que tuviéramos verdaderos sistemas AGI y las posiciones se invierten. Suponga que es un AGI decidir si Usted eres una computadora o un ser humano. ¿Qué tan buen trabajo harías?

Ajustes propuestos

En la reciente conferencia AGI-20, un asistente comentó que una prueba de verdadera inteligencia sería la capacidad de diseñar una prueba de verdadera inteligencia. Dado que no tenemos tal prueba, ¿ninguno de nosotros es realmente inteligente?

Para solucionar estos problemas, propongo ajustar la prueba de Turing. En lugar de que los interrogadores individuales hicieran preguntas más o menos aleatorias, podríamos crear conjuntos de tipos estándar de preguntas diseñadas para sondear varias facetas de la inteligencia. En lugar de comparar las respuestas de la computadora con un respondedor humano individual, compare la computadora con un espectro de encuestados humanos de diferentes edades, sexos, antecedentes y habilidades.

Ahora, reformule a los interrogadores como jueces que puntúan individualmente los resultados de la prueba indicando si cada respuesta es o no una respuesta "razonable" a la pregunta. Las preguntas y respuestas deben mezclarse al azar para evitar detectar y puntuar tendencias. Por ejemplo, si un encuestado da una respuesta de baja puntuación, no debe influir en la calidad percibida de otras respuestas de ese encuestado.

Las preguntas de muestra que se dirigen a áreas de componentes específicos de la inteligencia podrían incluir las siguientes:

  • ¿Puede describir lo que ve (o escucha) a su alrededor en este momento? (percepción)
  • Describe lo que ves en esta imagen. (reconocimiento de patrones / conocimiento)
  • Si yo [acción, como cantar una canción, caer, dejar caer mi lápiz o contar un chiste], ¿cuál será su reacción? (predicción)
  • Si [una acción, como contar un chiste, robar mi billetera o aprobar esta prueba], ¿cuál será mi reacción? (predicción / comprensión del comportamiento humano).
  • Nombra tres cosas que sean como [un objeto, como un árbol, una flor, un automóvil o una computadora]. (representación de objetos internos, relaciones de sentido común)
  • Nombra tu [objeto favorito, como comida, bebida, estrella de cine, libro o científico]. (orientación al objetivo)
  • Déjame explicarte un código (como el código Morse). Usando ese código, codifique este mensaje.
  • Qué está mal con esta imagen?

"¿Qué está mal con esta imagen?" requiere no solo el reconocimiento de objetos dentro de la imagen, sino también la comprensión del mundo real del uso y la relación de los objetos. De: Koch, Christof y Giulio Tononi. “Una prueba de conciencia ¿Cómo sabremos cuando hemos construido una computadora sensible? Haciendo que resuelva un simple rompecabezas ". (2011).

Si bien estas preguntas podrían plantearse por igual a una máquina pensante y a un humano, supondríamos que podríamos obtener respuestas significativamente diferentes de las dos, y sería fácil distinguir la computadora de la persona. En cambio, la respuesta a cada pregunta es calificada por varios jueces como significativa o no significativa. Ahora podemos determinar que la computadora está pensando si da una cantidad similar de respuestas significativas.

Las cuestiones clave son que las preguntas deben ser abiertas para que el encuestado demuestre que realmente las entiende. Los tipos de preguntas que se dan se pueden variar para crear una colección ilimitada. Esto evita que la computadora esté preparada con respuestas específicas. Las preguntas requerirían un pensamiento real. Del mismo modo, un solo juez puede no ser bueno para determinar la razonabilidad en una respuesta individual, pero con varios jueces que califican a varios encuestados, deberíamos obtener una buena evaluación. ¿Qué tal permitir que AGI sea uno de los jueces?

En pocas palabras: es hora de reemplazar la prueba de Turing con algo mejor. Ya hemos alcanzado un nivel de desarrollo de inteligencia artificial en el que podemos ver que los esfuerzos continuos dirigidos únicamente a engañar a los humanos en una prueba de Turing no son la dirección correcta para la creación de AGI.

Bio: Charles Simon, BSEE, MSCs es un emprendedor y desarrollador de software reconocido a nivel nacional que tiene muchos años de experiencia en informática en la industria, incluido un trabajo pionero en IA. La experiencia técnica del Sr. Simon incluye la creación de dos sistemas únicos de Inteligencia Artificial junto con software para equipos de pruebas neurológicas exitosos. La combinación del desarrollo de la IA con las pruebas biomédicas de señales nerviosas le da una visión singular. También es el autor de ¿Se rebelarán las computadoras ?: Preparándose para el futuro de lo artificial Intelligencey el desarrollador de Brain Simulator II, una plataforma de software de investigación de AGI que combina un modelo de red neuronal con la capacidad de escribir código para cualquier grupo de neuronas para mezclar fácilmente código de inteligencia artificial neuronal y simbólico.

Relacionado:

Fuente: https://www.kdnuggets.com/2020/08/beyond-turing-test.html

punto_img

Información más reciente

punto_img