Logotipo de Zephyrnet

Los 'murmullos' de la curva elíptica encontrados con IA toman vuelo | Revista Quanta

Fecha:

Introducción

Las curvas elípticas se encuentran entre los objetos más seductores de las matemáticas modernas. No parecen complicados, pero forman una vía rápida entre las matemáticas que mucha gente aprende en la escuela secundaria y la investigación de las matemáticas en su forma más abstrusa. Fueron fundamentales para la célebre demostración del último teorema de Fermat realizada por Andrew Wiles en la década de 1990. Son herramientas clave en la criptografía moderna. Y en 2000, el Instituto de Matemáticas Clay nombró a un conjetura sobre las estadísticas de curvas elípticas, uno de los siete “Problemas del Premio del Milenio”, cada uno de los cuales conlleva un premio de un millón de dólares por su solución. Esa conjetura, aventurada por primera vez por abedul bryan y Peter Swinnerton-Dyer en la década de 1960, todavía no se ha demostrado.

Comprender las curvas elípticas es una tarea de alto riesgo que ha sido fundamental para las matemáticas. Entonces, en 2022, cuando una colaboración transatlántica utilizó técnicas estadísticas e inteligencia artificial para descubrir patrones completamente inesperados en curvas elípticas, fue una contribución bienvenida, aunque inesperada. "Era sólo cuestión de tiempo antes de que el aprendizaje automático llegara a nuestra puerta con algo interesante", dijo Pedro Sarnak, matemático del Instituto de Estudios Avanzados y de la Universidad de Princeton. Inicialmente, nadie podía explicar por qué existen los patrones recién descubiertos. Desde entonces, en una serie de artículos recientes, los matemáticos han comenzado a descubrir las razones detrás de los patrones, denominados "murmuraciones" por su parecido con las formas fluidas de las bandadas de estorninos, y han comenzado a demostrar que deben ocurrir no solo en el particular ejemplos examinados en 2022, pero en curvas elípticas de manera más general.

La importancia de ser elíptico

Para entender cuáles son esos patrones, tenemos que sentar algunas bases sobre qué son las curvas elípticas y cómo las categorizan los matemáticos.

Una curva elíptica relaciona el cuadrado de una variable, comúnmente escrita como y, a la tercera potencia de otro, comúnmente escrito como x: y2 = x3 + Ax + B, para algún par de números A y B, Siempre y cuando A y B cumplir unas cuantas condiciones sencillas. Esta ecuación define una curva que se puede representar gráficamente en el plano, como se muestra a continuación. (A pesar de la similitud de los nombres, una elipse no es una curva elíptica).

Introducción

Aunque parecen sencillas, las curvas elípticas resultan ser herramientas increíblemente poderosas para los teóricos de números: matemáticos que buscan patrones en los números enteros. En lugar de dejar que las variables x y y abarcan todos los números, a los matemáticos les gusta restringirlos a diferentes sistemas numéricos, a lo que llaman definir una curva "sobre" un sistema numérico dado. Las curvas elípticas restringidas a los números racionales (números que pueden escribirse como fracciones) son particularmente útiles. "Las curvas elípticas sobre números reales o complejos son bastante aburridas", dijo Sarnak. "Sólo los números racionales son profundos".

Aquí hay una forma en que eso es cierto. Si trazas una línea recta entre dos puntos racionales en una curva elíptica, el lugar donde esa línea cruza nuevamente la curva también será racional. Puede utilizar ese hecho para definir "suma" en una curva elíptica, como se muestra a continuación.

Introducción

Dibuja una línea entre P y Q. Esa línea cortará la curva en un tercer punto, R. (Los matemáticos tienen un truco especial para tratar el caso en el que la recta no corta a la curva añadiendo un “punto en el infinito”). R a través del x-eje es tu suma P + Q. Junto con esta operación de suma, todas las soluciones de la curva forman un objeto matemático llamado grupo.

Los matemáticos usan esto para definir el "rango" de una curva. El rango de una curva se relaciona con el número de soluciones racionales que tiene. Las curvas de rango 0 tienen un número finito de soluciones. Las curvas con rango superior tienen un número infinito de soluciones cuya relación entre sí mediante la operación de suma se describe mediante el rango.

Los rangos no se comprenden bien; los matemáticos no siempre tienen una forma de calcularlos y no saben qué tan grandes pueden llegar a ser. (El rango exacto más grande conocido para una curva específica es 20). Las curvas de apariencia similar pueden tener rangos completamente diferentes.

Las curvas elípticas también tienen mucho que ver con los números primos, que sólo son divisibles por 1 y por sí mismos. En particular, los matemáticos observan las curvas sobre campos finitos: sistemas de aritmética cíclica que se definen para cada número primo. Un campo finito es como un reloj con el número de horas igual al primo: si sigues contando hacia arriba, los números empiezan de nuevo. En el cuerpo finito de 7, por ejemplo, 5 más 2 es igual a cero y 5 más 3 es igual a 1.

Introducción

Una curva elíptica tiene una secuencia de números asociada, llamada ap, que se relaciona con el número de soluciones que hay para la curva en el campo finito definido por el primo p. Un pequeño ap significa más soluciones; Uno más grande ap significa menos soluciones. Aunque el rango es difícil de calcular, la secuencia ap es mucho más fácil.

Sobre la base de numerosos cálculos realizados en una de las primeras computadoras, Birch y Swinnerton-Dyer conjeturaron una relación entre el rango de una curva elíptica y la secuencia ap. Cualquiera que pueda demostrar que tenía razón puede ganar un millón de dólares y la inmortalidad matemática.

Surge un patrón sorpresa

Después del inicio de la pandemia, Yang Hui He, investigador del Instituto de Ciencias Matemáticas de Londres, decidió asumir algunos nuevos desafíos. Se había graduado en física en la universidad y había obtenido su doctorado en física matemática en el Instituto Tecnológico de Massachusetts. Pero estaba cada vez más interesado en la teoría de números y, dadas las crecientes capacidades de la inteligencia artificial, pensó en intentar utilizar la IA como herramienta para encontrar patrones inesperados en los números. (Él ya había sido usando el aprendizaje automático clasificar Colectores de Calabi-Yau, estructuras matemáticas que se utilizan ampliamente en la teoría de cuerdas).

Introducción

En agosto de 2020, a medida que la pandemia se profundizaba, la Universidad de Nottingham lo acogió para una charla online. Se mostró pesimista sobre su progreso y sobre la posibilidad misma de utilizar el aprendizaje automático para descubrir nuevas matemáticas. "Su narrativa era que la teoría de números era difícil porque no se podían aprender cosas en teoría de números mediante máquinas", dijo Thomas oliver, un matemático de la Universidad de Westminster que estaba entre el público. Como recuerda, “no pude encontrar nada porque no era un experto. Ni siquiera estaba usando las cosas correctas para ver esto”.

Oliver y Kyu Hwan Lee, matemático de la Universidad de Connecticut, comenzó a trabajar con He. "Decidimos hacer esto sólo para aprender qué era el aprendizaje automático, en lugar de estudiar matemáticas en serio", dijo Oliver. "Pero rápidamente descubrimos que se podían aprender muchas cosas mediante la máquina".

Oliver y Lee sugirieron que aplicara sus técnicas para examinar L-funciones, series infinitas estrechamente relacionadas con curvas elípticas a través de la secuencia ap. Podrían utilizar una base de datos en línea de curvas elípticas y sus L-funciones llamadas LMFDB para entrenar a sus clasificadores de aprendizaje automático. En ese momento, la base de datos tenía poco más de 3 millones de curvas elípticas sobre las racionales. Para octubre de 2020, tenían un papel que utilizó información obtenida de L-funciones para predecir una propiedad particular de curvas elípticas. En noviembre compartieron otro papel que utilizó el aprendizaje automático para clasificar otros objetos en la teoría de números. En diciembre pudieron predecir los rangos de curvas elípticas con alta precisión.

Pero no estaban seguros de por qué sus algoritmos de aprendizaje automático funcionaban tan bien. Lee le preguntó a su estudiante Alexey Pozdnyakov si podía descubrir qué estaba pasando. Da la casualidad de que la LMFDB clasifica las curvas elípticas según una cantidad llamada conductor, que resume información sobre los números primos para los cuales una curva no se comporta bien. Así que Pozdnyakov intentó observar un gran número de curvas con conductores similares simultáneamente; digamos, todas las curvas con conductores entre 7,500 y 10,000.

Introducción

Esto equivalía a unas 10,000 curvas en total. Aproximadamente la mitad de estos tenían el rango 0 y la otra mitad el rango 1. (Los rangos más altos son extremadamente raros). Luego promedió los valores de ap para todas las curvas de rango 0, promediadas por separado ap para todas las curvas de rango 1 y trazó los resultados. Los dos conjuntos de puntos formaron dos ondas distintas y fácilmente discernibles. Por eso los clasificadores de aprendizaje automático pudieron determinar correctamente los rangos de curvas particulares.

"Al principio me sentí feliz de haber completado la tarea", dijo Pozdnyakov. "Pero Kyu-Hwan reconoció inmediatamente que este patrón era sorprendente, y fue entonces cuando se volvió realmente emocionante".

Lee y Oliver quedaron cautivados. “Alexey nos mostró la foto y dije que se parece a eso que hacen los pájaros”, dijo Oliver. “Y luego Kyu-Hwan lo buscó y dijo que se llama murmuración, y luego Yang dijo que deberíamos llamar al periódico 'Murmullos de curvas elípticas. '"

Subieron su artículo en abril de 2022 y lo enviaron a un puñado de otros matemáticos, esperando nerviosamente que les dijeran que su llamado “descubrimiento” era bien conocido. Oliver dijo que la relación era tan visible que debería haberse notado hace mucho tiempo.

Introducción

Casi de inmediato, la preimpresión despertó el interés, particularmente de andres sutherland, un científico investigador del MIT que es uno de los editores jefe de la LMFDB. Sutherland se dio cuenta de que 3 millones de curvas elípticas no eran suficientes para sus propósitos. Quería observar rangos de conductores mucho más grandes para ver cuán robustas eran las murmuraciones. Extrajo datos de otro inmenso depósito de alrededor de 150 millones de curvas elípticas. Aún insatisfecho, extrajo datos de un repositorio diferente con 300 millones de curvas.

"Pero ni siquiera eso fue suficiente, así que calculé un nuevo conjunto de datos de más de mil millones de curvas elípticas, y eso es lo que usé para calcular las imágenes de muy alta resolución", dijo Sutherland. Las murmuraciones surgieron ya sea que promediara más de 15,000 curvas elípticas a la vez o un millón a la vez. La forma permaneció igual incluso cuando observó las curvas de números primos cada vez más grandes, un fenómeno llamado invariancia de escala. Sutherland también se dio cuenta de que las murmuraciones no son exclusivas de las curvas elípticas, sino que también aparecen en formas más generales. L-funciones. El escribio una carta que resume sus hallazgos y lo envió a Sarnak y miguel rubinstein en la Universidad de Waterloo.

"Si existe una explicación conocida, espero que la conozcan", escribió Sutherland.

No lo hicieron.

Explicando el patrón

Lee, He y Oliver organizaron un taller sobre murmuraciones en agosto de 2023 en el Instituto de Investigación Computacional y Experimental en Matemáticas (ICERM) de la Universidad de Brown. Vinieron Sarnak y Rubinstein, al igual que el alumno de Sarnak. Nina Zubrilina.

Zubrilina presentó su investigación sobre patrones de murmuración en formas modulares, funciones complejas especiales que, como curvas elípticas, tienen asociadas L-funciones. En formas modulares con grandes conductores, los murmullos convergen en una curva claramente definida, en lugar de formar un patrón discernible pero disperso. En un papel Publicado el 11 de octubre de 2023, Zubrilina demostró que este tipo de murmuraciones sigue una fórmula explícita que descubrió.

“El gran logro de Nina es que le ha dado una fórmula para ello; Yo lo llamo la fórmula de densidad de murmuración de Zubrilina”, dijo Sarnak. "Utilizando matemáticas muy sofisticadas, ha demostrado una fórmula exacta que se ajusta perfectamente a los datos".

Su fórmula es complicada, pero Sarnak la saluda como un nuevo e importante tipo de función, comparable a las funciones de Airy que definen soluciones a ecuaciones diferenciales utilizadas en una variedad de contextos de la física, desde la óptica hasta la mecánica cuántica.

Aunque la fórmula de Zubrilina fue la primera, le siguieron otras. "Cada semana se publica un nuevo artículo", dijo Sarnak, "que utiliza principalmente las herramientas de Zubrilina y explica otros aspectos de las murmuraciones".

jonathan bober, Andrés Booker y min lee de la Universidad de Bristol, junto con David Lowry-Duda de ICERM, demostró la existencia de un tipo diferente de murmuración en formas modulares en otro periódico de octubre. Y Kyu-Hwan Lee, Oliver y Pozdnyakov demostró la existencia de murmuraciones en objetos llamados personajes de Dirichlet que están estrechamente relacionados con L-funciones.

Sutherland quedó impresionado por la importante dosis de suerte que había conducido al descubrimiento de las murmuraciones. Si los datos de la curva elíptica no hubieran sido ordenados por conductor, las murmuraciones habrían desaparecido. "Tuvieron la suerte de poder tomar datos del LMFDB, que venían preclasificados según el conductor", dijo. “Es lo que relaciona una curva elíptica con la forma modular correspondiente, pero eso no es nada obvio. … Dos curvas cuyas ecuaciones parecen muy similares pueden tener conductores muy diferentes”. Por ejemplo, Sutherland señaló que y2 = x3 11 Mayox + 6 tiene el conductor 17, pero al cambiar el signo menos a un signo más, y2 = x3 + 11x + 6 tiene conductor 100,736.

Incluso entonces, las murmuraciones sólo surgieron debido a la inexperiencia de Pozdnyakov. "No creo que lo hubiéramos encontrado sin él", dijo Oliver, "porque los expertos tradicionalmente normalizan ap tener un valor absoluto 1. Pero no los normalizó... así que las oscilaciones fueron muy grandes y visibles”.

Los patrones estadísticos que utilizan los algoritmos de IA para clasificar las curvas elípticas por rango existen en un espacio de parámetros con cientos de dimensiones, demasiadas para que las personas las clasifiquen mentalmente, y mucho menos las visualicen, señaló Oliver. Pero aunque el aprendizaje automático encontró las oscilaciones ocultas, “sólo más tarde comprendimos que eran murmullos”.

Nota del editor: Andrew Sutherland, Kyu-Hwan Lee y la base de datos de formas modulares y funciones L (LMFDB) han recibido financiación de la Fundación Simons, que también financia esta publicación editorial independiente. Las decisiones de financiación de la Fundación Simons no influyen en nuestra cobertura. Hay más información disponible esta página.

punto_img

Información más reciente

punto_img