Logotipo de Zephyrnet

ForceGen: uso de un modelo de difusión para ayudar a diseñar nuevas proteínas

Fecha:

Aunque las proteínas se componen sólo de una pequeña cantidad de aminoácidos distintos, esta simplicidad engañosa se desvanece rápidamente al considerar las muchas secuencias posibles a través de una proteína, sin mencionar las muchas maneras en que una sola secuencia de proteína 1D puede plegarse en una forma de proteína 3D. con una funcionalidad específica. Aunque la evolución natural ya ha hecho gran parte del trabajo preliminar, descubrir nuevas secuencias y su funcionalidad es una tarea desalentadora en la que se aplican algoritmos de aprendizaje cada vez más profundos. Como [Bo Ni] y colegas informe en un artículo de investigación in Science Advances, el desafío más difícil es diseñar una secuencia de proteínas basada en la funcionalidad deseada. Luego demuestran una forma de utilizar un modelo generativo para acelerar este proceso.

Se propusieron diseñar proteínas con propiedades mecánicas específicas, para lo cual utilizaron las características de despliegue conocidas de varias secuencias de proteínas para entrenar un modelo de difusión. Por lo tanto, este enfoque se parece más a la tecnología detrás de los algoritmos de generación de imágenes como DALL-E que a los LLM. Utilizando el modelo de difusión entrenado fue posible generar secuencias probables cuyas propiedades luego podrían simularse, con resultados favorables.

Como ayuda para un gran conjunto de datos, un modelo de difusión de este tipo podría ser muy útil en campos incluso más allá de la síntesis de proteínas, automatizando tareas tediosas y posiblemente acelerando los descubrimientos.

punto_img

Información más reciente

punto_img