Para entender cómo funciona el mundo, a veces, hay que empezar por lo más básico. Por las piezas sobre las que se construye todo lo demás. Muchos de los grandes descubrimientos científicos, de hecho, empiezan interpelando a las protagonistas ocultas sobre las que se construyen todas las formas de vida: las proteínas. Entender cómo funcionan, cómo interactúan con el entorno o cómo se pliegan resulta clave para tanto para descifrar enigmas de la biología y como para plantear soluciones efectivas ante problemas estructurales. Todo este complejo camino se simplifica, en parte, a partir de ahora con la publicación ayer de la base de datos más completa hasta la fecha sobre predicciones de estructuras 3D de proteínas humanas.

DeepMind, el sistema de inteligencia artificial desarrollado por Google, y el Laboratorio Europeo de Biología Molecular (EMBL) anuncian este mismo miércoles la creación de esta iniciativa que proporcionará de manera gratuita y abierta los datos sobre 20.000 proteínas expresadas en el genoma humano. En la práctica, esta iniciativa se convertirá en una hemeroteca para entender el 98,5% de todas las proteínas humanas. Este «tesoro de datos», a su vez, también proporcionará información muy valiosa para comprender los procesos biológicos, para entender la base de enfermedades raras y para guiar el desarrollo de tratamientos y fármacos. La estrella de este anuncio es ni más ni menos que un algoritmo de inteligencia artificial de última generación: AlphaFold. La herramienta ha sido diseñada como un algoritmo de aprendizaje automático (o deep-learning) que, lejos de quedarse exclusivamente con las instrucciones de los programadores, aprende y mejora sobre la marcha. En diciembre del año pasado, DeepMind anunció que su algoritmo había logrado predecir de manera rápida y precisa la forma tridimensional de las proteínas humanas. Y esto, en palabras del biólogo evolutivo Andrei Lupas a la revista Nature, significaba «cambiarlo todo». Más ahora, que esta información será accesible para toda la comunidad científica.

50 años de enigmas

La comunidad científica lleva al menos cincuenta años inmersa en el ‘problema del plegamiento de las proteínas’. De hecho, como decíamos hace un momento, entender la estructura de estas macromoléculas es clave para descifrar la causa estructural de enfermedades y todo tipo de dolencias. ¿El problema? Que esta pregunta, lejos de ser sencilla de responder, a menudo requiere meses o años de investigación. Y muchas veces ni así se consigue resolver. La irrupción de la inteligencia artificial en este proceso podría desatascar enigmas irresueltos y, a la vez, ayudaría a avanzar más rápidamente la investigación científica. El estreno de esta base de datos también ahondará en información sobre otros organismos clave en el avance científico.