Logotipo de Zephyrnet

Investigadores enseñan a la IA a identificar mutaciones vinculadas al cáncer

Fecha:

Las técnicas de aprendizaje automático, como el aprendizaje profundo, han demostrado ser sorprendentemente eficaces para identificar enfermedades como el cáncer de mama. Sin embargo, cuando se trata de identificar mutaciones a nivel genético, estos modelos se han quedado cortos, según investigadores de la Universidad de California en San Diego (UCSD).

En un papel publicado en la revista Nature Biotechnology esta semana, los investigadores de la universidad proponen un nuevo marco de aprendizaje automático llamado DeepMosaic que utiliza una combinación de visualización basada en imágenes y modelos de aprendizaje profundo para identificar mutaciones genéticas asociadas con enfermedades, incluido el cáncer y trastornos con vínculos genéticos, como desorden del espectro autista.

El uso de AI/ML para identificar enfermedades ha sido un tema candente en los últimos años. Por ejemplo, en agosto, los científicos de Harvard detallado un sistema de IA multimodal capaz de predecir 14 tipos de cáncer.

El problema, según el profesor de UCSD Joe Gleeson, es que la mayoría de estos modelos no son adecuados para identificar mutaciones genéticas, llamadas variantes o mutaciones en mosaico, porque la mayor parte del software desarrollado en las últimas dos décadas se entrenó en muestras de cáncer.

Debido a que las células cancerosas se dividen tan rápido, son relativamente fáciles de detectar para los programas de computadora, explicó en una entrevista con El registro. En comparación, las mutaciones en mosaico son difíciles de detectar porque existen solo en un subconjunto de células.

Al contrario de lo que le hayan enseñado en la escuela primaria, cuando las células se dividen, no son una copia perfecta entre sí. Hay pequeños cambios o mutaciones, explicó Gleeson. Estas mutaciones suelen ser inofensivas, pero a veces provocan cáncer u otras enfermedades. Esto hace que los métodos para identificar mutaciones potencialmente problemáticas sean tan valiosos.

Pero hasta hace poco “no había una buena manera de identificar esas mutaciones a partir de la secuenciación del ADN”, dijo. “Lo que presentamos en este documento es una nueva forma de hacer eso [que] aprovecha el aprendizaje profundo”.

Buceando en DeepMosaic

El propio marco DeepMosaic se entrenó en 180,000 80 variantes de mosaico utilizando nodos de GPU Nvidia Kepler KXNUMX alojados en el clúster de cómputo Comet del San Diego Supercomputing Center.

Disponible como un modelo preentrenado de código abierto, el marco funciona convirtiendo secuencias genómicas en imágenes y luego aplica una red neuronal convolucional de aprendizaje profundo para identificar mutaciones en mosaico, dijo Xiaoxu Yang, investigador postdoctoral que trabaja en el proyecto. El registro.

Y a diferencia de algunos modelos de aprendizaje automático, cualquiera que implemente DeepMosaic no debería necesitar condicionar sus datos a menos que planee volver a entrenar el modelo.

En comparación con los métodos existentes, los investigadores afirman que el modelo puede identificar estas mutaciones con mayor precisión. Y en comparación con el proceso de verificación manual requerido por los métodos convencionales, también es muchísimo más rápido, señaló Gleeson.

Con suficiente potencia de GPU, Yang dice que DeepMosaic debería ser capaz de analizar un perfil genómico completo en una hora. Y aunque el modelo se entrenó en Comet, eso no significa que necesite una supercomputadora para ejecutar o incluso volver a entrenar el modelo. Está completamente dentro del ámbito de la posibilidad de que alguien entrene a DeepMosaic usando una estación de trabajo personal, afirmó.

El marco también ofrece claras ventajas en comparación con los modelos desarrollados específicamente con el cáncer en mente, dijo Yang. La mayoría de estos programas requieren una muestra de control no relacionada con el cáncer. Esto hace que su uso para identificar variantes de mosaico no sea práctico, ya que las mutaciones pueden extenderse a través de múltiples tejidos.

DeepMosaic "es independiente del control, lo que significa que podemos observar aquellas variantes que comparten diferentes tejidos", dijo.

Si bien es mejor para identificar variantes de mosaico, los investigadores señalan que DeepMosaic, al menos en su forma actual, no es práctico para muestras de cáncer.

Pero como señala Gleeson, ser capaz de identificar con precisión estas mutaciones es un primer paso hacia el desarrollo de tratamientos médicos.

Un clon de Git de distancia

Los investigadores interesados ​​en probar DeepMosaic no tendrán que ir muy lejos. El marco, la documentación y las demostraciones necesarias para implementarlo y probarlo están disponibles para descargar en GitHub.

Además del modelo preentrenado, los investigadores también han incluido todas las herramientas necesarias para volver a entrenar el modelo en sus propios conjuntos de datos.

Según Gleeson, todavía hay mucho margen de mejora. "Mucho del trabajo actual en genética humana es con ascendencia europea", explicó, y agregó que existe la oportunidad de aplicar estas herramientas a diferentes ascendencias.

Más allá de identificar firmas de enfermedades, DeepMosaic puede tener aplicaciones en campos adyacentes. “Nuestro modelo está muy bien ajustado para detectar diferencias sutiles en los archivos de secuencias genómicas de una sola persona, pero creo que la herramienta probablemente tenga aplicaciones en otros campos”, dijo Gleeson. “Por ejemplo, en medicina forense, donde escuchamos mucho en las noticias sobre la comparación del ADN con las bases de datos públicas”.

Las oportunidades de herramientas, como DeepMosaic, para mejorar la salud humana y la comprensión seguirán creciendo a medida que el costo de la secuenciación del genoma continúe cayendo, agregó Yang. ®

punto_img

Información más reciente

punto_img