Logotipo de Zephyrnet

La nueva IA de Google DeepMind iguala el rendimiento de la medalla de oro en las Olimpiadas de Matemáticas

Fecha:

Después descifrar una matemática irresoluble problema el año pasado, la IA ha vuelto para abordar la geometría.

Desarrollado por Google DeepMind, un nuevo algoritmo, AlphaGeometry, puede solucionar problemas de Olimpíadas Internacionales de Matemáticas anteriores (una competencia de alto nivel para estudiantes de secundaria) y iguala el desempeño de anteriores medallistas de oro.

Cuando se le planteó 30 problemas de geometría difíciles, la IA resolvió con éxito 25 dentro del tiempo asignado estándar, superando a los algoritmos de última generación anteriores por 15 respuestas.

Si bien a menudo se considera la pesadilla de la clase de matemáticas de la escuela secundaria, la geometría está arraigada en nuestra vida cotidiana. El arte, la astronomía, el diseño de interiores y la arquitectura se basan en la geometría. También lo hacen la navegación, los mapas y la planificación de rutas. En esencia, la geometría es una forma de describir el espacio, las formas y las distancias mediante el razonamiento lógico.

En cierto modo, resolver problemas de geometría es un poco como jugar al ajedrez. Dadas algunas reglas (llamadas teoremas y demostraciones), hay un número limitado de soluciones para cada paso, pero encontrar cuál tiene sentido depende de un razonamiento flexible que se ajuste a reglas matemáticas estrictas.

En otras palabras, abordar la geometría requiere tanto creatividad como estructura. Mientras que los humanos desarrollan estas habilidades acrobáticas mentales a través de años de práctica, la IA siempre ha tenido problemas.

AlphaGeometry combina inteligentemente ambas funciones en un solo sistema. Tiene dos componentes principales: un modelo lógico sujeto a reglas que intenta encontrar una respuesta y un modelo de lenguaje grande para generar ideas innovadoras. Si la IA no logra encontrar una solución basada únicamente en el razonamiento lógico, el modelo de lenguaje interviene para proporcionar nuevos ángulos. El resultado es una IA con creatividad y habilidades de razonamiento que pueden explicar su solución.

El sistema es la última incursión de DeepMind en la resolución de problemas matemáticos con inteligencia artificial. Pero sus ojos están puestos en un premio mayor. AlphaGeometry está diseñado para el razonamiento lógico en entornos complejos, como nuestro caótico mundo cotidiano. Más allá de las matemáticas, las iteraciones futuras podrían ayudar a los científicos a encontrar soluciones en otros sistemas complicados, como descifrar conexiones cerebrales o desentrañar redes genéticas que conducen a enfermedades.

"Estamos dando un gran salto, un gran avance en términos de resultados", dijo el autor del estudio, el Dr. Trieu Trinh. les dijo a las New York Times.

Double Team

Una pregunta rápida sobre geometría: imagina un triángulo con ambos lados de igual longitud. ¿Cómo se prueba que los dos ángulos inferiores son exactamente iguales?

Este es uno de los primeros desafíos que enfrentó AlphaGeometry. Para resolverlo, es necesario comprender plenamente las reglas de la geometría, pero también tener creatividad para avanzar lentamente hacia la respuesta.

"La demostración de teoremas demuestra el dominio del razonamiento lógico... lo que significa una habilidad notable para la resolución de problemas", dijo el equipo. escribió en una investigación publicada hoy en Naturaleza.

Aquí es donde sobresale la arquitectura de AlphaGeometry. Apodado un sistema neurosimbólico, primero aborda un problema con su motor de deducción simbólica. Imagine estos algoritmos como un estudiante de grado A que estudia estrictamente libros de texto de matemáticas y sigue reglas. Se guían por la lógica y pueden exponer fácilmente cada paso que conduce a una solución, como explicar una línea de razonamiento en un examen de matemáticas.

Estos sistemas son de la vieja escuela pero increíblemente poderosos, ya que no tienen el problema de la “caja negra” que acecha a muchos de los algoritmos modernos de aprendizaje profundo.

El aprendizaje profundo ha remodelado nuestro mundo. Pero debido a cómo funcionan estos algoritmos, a menudo no pueden explicar su resultado. Esto simplemente no sirve cuando se trata de matemáticas, que se basan en un razonamiento lógico estricto que se puede escribir.

Los motores de deducción simbólica contrarrestan el problema de la caja negra porque son racionales y explicables. Pero ante problemas complejos, son lentos y luchan por adaptarse con flexibilidad.

Aquí es donde entran los grandes modelos de lenguaje. La fuerza impulsora detrás de ChatGPT, estos algoritmos son excelentes para encontrar patrones en datos complicados y generar nuevas soluciones, si hay suficientes datos de entrenamiento. Pero a menudo carecen de la capacidad de explicarse, por lo que es necesario volver a comprobar sus resultados.

AlphaGeometry combina lo mejor de ambos mundos.

Cuando nos enfrentamos a un problema de geometría, el motor de deducción simbólica lo intenta primero. Tomemos el problema del triángulo. El algoritmo "comprende" la premisa de la pregunta, ya que necesita demostrar que los dos ángulos inferiores son iguales. Luego, el modelo de lenguaje sugiere dibujar una nueva línea desde la parte superior del triángulo hasta la parte inferior para ayudar a resolver el problema. Cada nuevo elemento que mueve a la IA hacia la solución se denomina "construcción".

El motor de deducción simbólica toma el consejo y escribe la lógica detrás de su razonamiento. Si la construcción no funciona, los dos sistemas pasan por múltiples rondas de deliberación hasta que AlphaGeometry llega a la solución.

Toda la configuración es "similar a la idea de 'pensar, rápido y lento'". escribí el equipo en el blog de DeepMind. "Un sistema proporciona ideas rápidas e 'intuitivas', y el otro, una toma de decisiones más deliberada y racional".

Somos los campeones

A diferencia de los archivos de texto o audio, hay escasez de ejemplos centrados en la geometría, lo que dificulta el entrenamiento de AlphaGeometry.

Como solución alternativa, el equipo generó su propio conjunto de datos con 100 millones de ejemplos sintéticos de formas geométricas aleatorias y relaciones mapeadas entre puntos y líneas, similar a cómo se resuelve geometría en la clase de matemáticas, pero a una escala mucho mayor.

A partir de ahí, la IA comprendió las reglas de la geometría y aprendió a trabajar hacia atrás desde la solución para determinar si era necesario agregar alguna construcción. Este ciclo permitió a la IA aprender desde cero sin ninguna intervención humana.

Al poner a prueba la IA, el equipo la desafió con 30 problemas de Olimpíadas de más de una década de competiciones anteriores. Los resultados generados fueron evaluados por un medallista de oro anterior de la Olimpiada, Evan Chen, para garantizar su calidad.

En total, la IA igualó el desempeño de los anteriores medallistas de oro, completando 25 problemas dentro del límite de tiempo. El resultado previo del estado del arte Fueron 10 respuestas correctas.

"El resultado de AlphaGeometry es impresionante porque es verificable y limpio", Chen dijo. "Utiliza reglas de geometría clásica con ángulos y triángulos similares tal como lo hacen los estudiantes".

Más allá de las matemáticas

AlphaGeometry es la última incursión de DeepMind en las matemáticas. en 2021, su IA resolvió acertijos matemáticos que habían dejado perplejos a los humanos durante décadas. Más recientemente, usaron grandes modelos de lenguaje para razonar problemas STEM a nivel universitario y agrietado un problema matemático previamente “irresoluble” basado en un juego de cartas con el algoritmo Búsqueda Divertida.

Por ahora, AlphaGeometry se adapta a la geometría y con salvedades. Gran parte de la geometría es visual, pero el sistema no puede "ver" los dibujos, lo que podría acelerar la resolución de problemas. Agregar imágenes, tal vez con La IA Géminis de Google, lanzado a finales del año pasado, puede reforzar su inteligencia geométrica.

Una estrategia similar también podría ampliar el alcance de AlphaGeometry a una amplia gama de dominios científicos que requieren un razonamiento riguroso con un toque de creatividad. (Seamos realistas: son todos).

"Dado el mayor potencial de entrenar sistemas de IA desde cero con datos sintéticos a gran escala, este enfoque podría moldear cómo los sistemas de IA del futuro descubren nuevos conocimientos, en matemáticas y más allá", escribió el equipo.

Crédito de la imagen: joel filipe / Unsplash 

punto_img

Información más reciente

punto_img