Logotipo de Zephyrnet

Lectura de la mente con IA: los investigadores traducen las ondas cerebrales en imágenes

Fecha:

Lectura de la mente con IA: los investigadores traducen las ondas cerebrales en imágenes
Imagen por editor

Imagina revivir tus recuerdos o construir imágenes de lo que alguien está pensando. Suena como algo sacado directamente de una película de ciencia ficción, pero con los avances recientes en visión por computadora y aprendizaje profundo, se está convirtiendo en una realidad. Aunque los neurocientíficos todavía luchan por desmitificar verdaderamente cómo el cerebro humano convierte lo que nuestros ojos ven en imágenes mentales, parece que la IA está mejorando en esta tarea. Dos investigadores, de la Escuela de Graduados de Frontier Biosciences de la Universidad de Osaka, propusieron un nuevo método usando un LDM llamado Stable Diffusion que reconstruyó con precisión las imágenes de la actividad del cerebro humano que se obtuvo mediante imágenes de resonancia magnética funcional (fMRI). Aunque el papel “Reconstrucción de imágenes de alta resolución con modelos de difusión latente de la actividad del cerebro humano“  by yu takagi y Shinji Nishimotois aún no ha sido revisado por pares, ha arrasado en Internet ya que los resultados son sorprendentemente precisos.

Esta tecnología tiene el potencial de revolucionar campos como la psicología, la neurociencia e incluso el sistema de justicia penal. Imagine que a un sospechoso se le pregunta dónde estaba durante el asesinato y responde que estaba en casa. Pero la imagen reconstruida lo muestra en la escena del crimen. ¿Bastante interesante verdad? Entonces, ¿cómo funciona exactamente? Profundicemos en este trabajo de investigación, sus limitaciones y su alcance futuro.

Los investigadores utilizaron el Conjunto de datos de escenas naturales (NSD)  proporcionada por la Universidad de Minnesota. Contenía datos obtenidos de escaneos fMRI de cuatro sujetos que habían mirado 10,000 imágenes diferentes. Se utilizó un subconjunto de 982 imágenes vistas por los cuatro sujetos como conjunto de datos de prueba. Durante el proceso se entrenaron dos modelos de IA diferentes. Uno se usó para vincular la actividad cerebral con las imágenes de resonancia magnética funcional, mientras que el otro se usó para vincularlo con las descripciones de texto de las imágenes que miraban los sujetos. Juntos, estos modelos permitieron que Stable Diffusion convirtiera los datos de fMRI en imitaciones relativamente precisas de las imágenes que no formaban parte de su entrenamiento, logrando una precisión de casi el 80 %.

 

Lectura de la mente con IA: los investigadores traducen las ondas cerebrales en imágenes
Imágenes originales (izquierda) e imágenes generadas por IA para los cuatro sujetos
 

El primer modelo pudo regenerar efectivamente el diseño y la perspectiva de la imagen que se estaba viendo. Pero el modelo luchó con objetos específicos como la torre del reloj y creó figuras abstractas y nubladas. En lugar de usar grandes conjuntos de datos para predecir más detalles, los investigadores usaron el segundo modelo de IA para asociar las palabras clave de los títulos de las imágenes con las exploraciones de IRMf. Por ejemplo, si los datos de entrenamiento tienen una imagen de una torre de reloj, el sistema asocia el patrón de actividad cerebral con ese objeto. Durante la etapa de prueba, si el sujeto participante exhibió un patrón cerebral similar, entonces el sistema introduce la palabra clave de objetos en el generador normal de texto a imagen de Stable Diffusion que resultó en una imitación convincente de la imagen real. 

 

Lectura de la mente con IA: los investigadores traducen las ondas cerebrales en imágenes
(más a la izquierda) Fotos vistas por los participantes del estudio, (2º) Diseño y perspectiva usando patrones de actividad cerebral solo, (3º) Imagen solo con información textual, (más a la derecha) Adición de información textual y patrones de actividad cerebral para recrear el objeto en el  
 

En este documento, los investigadores también afirmaron que el estudio fue el primero de su tipo en el que cada componente de LDM (difusión estable) se interpretó cuantitativamente desde una perspectiva neurocientífica. Lo hicieron asignando los componentes específicos a las distintas regiones del cerebro. Aunque el modelo propuesto aún se encuentra en una etapa incipiente, la gente reaccionó rápidamente a este documento y calificó al modelo como el próximo lector de mentes. 

Aunque la precisión de este modelo es bastante impresionante, se probó en el escáner cerebral de las personas que proporcionaron los escáneres cerebrales de entrenamiento. El uso de los mismos datos para los conjuntos de entrenamiento y prueba puede dar lugar a un sobreajuste. Sin embargo, no debemos ignorar este artículo, ya que tales publicaciones atraen a los investigadores y comenzamos a ver artículos relacionados con mejoras incrementales.

Teniendo en cuenta las mejoras en el campo de la visión artificial, este artículo me hace pensar: ¿Seremos capaces de revivir nuestros sueños pronto? Bastante genial y aterrador al mismo tiempo. Aunque es bastante intrigante, plantea algunas preocupaciones éticas sobre la invasión de la privacidad. Además, todavía queda un largo camino por recorrer antes de que podamos crear la experiencia subjetiva de un sueño. El modelo aún no es práctico para el uso diario, pero estamos cada vez más cerca de comprender cómo funciona nuestro cerebro. Dicha tecnología también puede generar enormes avances en el campo de la medicina, especialmente para las personas que tienen problemas de comunicación. 

Si el refinamiento del modelo propuesto entra en escena, este puede ser el PRÓXIMO AVANCE en el mundo de la IA. Pero los beneficios y los riesgos deben sopesarse antes de la implementación generalizada de cualquier tecnología. Espero que hayan disfrutado leyendo este artículo y me encantaría escuchar sus opiniones sobre este increíble trabajo de investigación.
 
 
Kanwal Mehreen es un aspirante a desarrollador de software con un gran interés en la ciencia de datos y las aplicaciones de IA en medicina. Kanwal fue seleccionado como Google Generation Scholar 2022 para la región APAC. A Kanwal le encanta compartir conocimientos técnicos escribiendo artículos sobre temas de actualidad y le apasiona mejorar la representación de las mujeres en la industria tecnológica.
 

punto_img

Información más reciente

punto_img