jueves, agosto 05, 2021

El mayor catálogo de predicciones de estructuras 3D de proteínas humanas

Gracias a la inteligencia artificial, se proporcionará de manera gratuita y abierta a la comunidad científica la base de datos de los modelos de predicciones de las estructuras del proteoma humano más completa y precisa de la historia. La iniciativa se ha puesto en marcha mediante la colaboración entre la empresa DeepMind y el Laboratorio Europeo de Biología Molecular (EMBL), el principal laboratorio europeo en ciencias biológicas.

El catálogo públicamente disponible incluirá alrededor de 20.000 proteínas expresadas por el genoma humano. La base de datos y el sistema de inteligencia artificial que la ha hecho posible brindan a los biólogos estructurales nuevas y poderosas herramientas para examinar la estructura tridimensional de las proteínas, y ofrecen un tesoro de datos que podría abrir el camino a futuros avances y presagiar una nueva era para la biología basada en la inteligencia artificial.

En diciembre de 2020, los organizadores de la evaluación comparativa Critical Assessment of Protein Structure Prediction (CASP) reconocieron AlphaFold como una solución al gran desafío, vigente desde hacía más de 50 años, que era predecir la estructura de tales proteínas. Los resultados conseguidos por AlphaFold constituyeron un logro asombroso en el campo.

La base de datos de estructura de proteínas AlphaFold (AlphaFold Protein Structure Database) se basa en esta innovación y en los descubrimientos de generaciones de científicos y científicas, desde los pioneros y las pioneras de la cristalografía y el análisis de estructura de las proteínas, hasta los miles de especialistas en predicción y biólogos y biólogas estructurales que han pasado años experimentando con proteínas desde entonces y que han compartido sus resultados de forma abierta. La base de datos explota y amplía drásticamente el conocimiento acumulado sobre las estructuras de proteínas, más que duplicado el número de estructuras de proteínas humanas con predicciones de alta precisión disponibles para los investigadores. Avanzar en la comprensión de estos componentes básicos de la vida, que sustentan los procesos biológicos en todos los seres vivos, permitirá a los investigadores de una gran variedad de campos acelerar su trabajo.

Estructuras proteicas representando datos obtenidos vía AlphaFold. (Imagen: AlphaFold / Karen Arnott / EMBL-EBI)

Recientemente se publicó en la revista académica Nature la metodología de la última e innovadora versión de AlphaFold, el sofisticado sistema de inteligencia artificial anunciado en diciembre pasado que impulsa estas predicciones de estructura, y su código fuente abierto. El nuevo anuncio coincide con la publicación en Nature de un segundo estudio que proporciona la imagen más completa de las proteínas que componen el proteoma humano, y la publicación de las proteínas de 20 organismos adicionales que son importantes para la investigación biológica.

"Nuestro objetivo en DeepMind siempre ha sido construir inteligencia artificial y utilizarla como una herramienta para ayudar a acelerar el ritmo del progreso científico, y mejorar así el conocimiento del mundo que nos rodea", declara el fundador y director ejecutivo de DeepMind, Demis Hassabis. "Hemos utilizado AlphaFold para generar la imagen más completa y precisa del proteoma humano. Creemos que esta es la contribución más significativa que ha hecho la inteligencia artificial al avance del conocimiento científico hasta la fecha, y es un gran ejemplo de los tipos de beneficios que la inteligencia artificial puede aportar a la sociedad".

AlphaFold ya está ayudando a los científicos a acelerar sus descubrimientos. La capacidad de predecir computacionalmente la forma de una proteína a partir de su secuencia de aminoácidos, en vez de tener que determinarla experimentalmente con técnicas minuciosas, laboriosas, y a menudo costosas, ya está ayudando a los científicos a lograr en meses lo que antes requería años de trabajo.

"La base de datos AlphaFold es un ejemplo perfecto del círculo virtuoso de la ciencia abierta", destaca la directora general del EMBL, Edith Heard. "AlphaFold ha sido entrenado utilizando datos de recursos públicos creados por la comunidad científica, por lo que tiene sentido que sus predicciones sean públicas. Compartir las predicciones de AlphaFold de forma abierta y gratuita permitirá a los investigadores de todo el mundo obtener nuevos conocimientos e impulsar nuevos descubrimientos. Creo que AlphaFold es una verdadera revolución para las ciencias de la vida, como lo fue la genómica hace varias décadas y estoy muy orgullosa de que el EMBL haya podido ayudar a DeepMind a permitir el acceso abierto a este recurso extraordinario".

AlphaFold ya está siendo utilizado por socios como la Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi, por sus siglas en inglés), que ha avanzado en su investigación sobre curas que salvan vidas para enfermedades que afectan de manera desproporcionada a las zonas más pobres del mundo, o el Centro de Innovación Enzimática (CEI) que utiliza AlphaFold para ayudar a diseñar enzimas más rápidas para reciclar algunos de los plásticos más contaminantes de un solo uso. AlphaFold ha ayudado a acelerar la investigación de aquellos científicos y científicas que trabajan en la determinación experimental de la estructura de las proteínas. Por ejemplo, un equipo de la Universidad de Colorado en Boulder (Estados Unidos) utiliza las predicciones de AlphaFold para estudiar la resistencia a los antibióticos, mientras que un grupo de la Universidad de California en San Francisco (Estados Unidos) las ha utilizado para estudiar la biología del SARS-CoV-2.

La base de datos de estructura de proteínas AlphaFold está basada en muchas contribuciones de la comunidad científica internacional, así como en las refinadas innovaciones algorítmicas de AlphaFold y en las décadas de experiencia del Instituto Europeo de Bioinformática del EMBL (EMBL-EBI) compartiendo datos biológicos mundiales. DeepMind y el EMBL-EBI están dando libre acceso a las predicciones de AlphaFold para que cualquiera pueda usar el sistema con el fin de permitir y acelerar la investigación y explorar nuevas vías de conocimiento científico.

"Este será uno de los conjuntos de datos más importantes desde el mapa del Genoma Humano", ha dicho el Director General Adjunto del EMBL y el director del EMBL-EBI, Ewan Birney. "Hacer que las predicciones de AlphaFold sean accesibles a la comunidad científica internacional abre muchas nuevas vías de investigación, desde enfermedades desatendidas hasta nuevas enzimas para la biotecnología y mucho más. Esta es una nueva y gran herramienta científica, que complementa las tecnologías existentes y nos permitirá ampliar los límites de nuestra comprensión del mundo".

Entre las primeras más de 350.000 estructuras publicadas en la base de datos, además del proteoma humano, están las proteínas de 20 organismos biológicamente significativos como la bacteria E. coli, la mosca de la fruta, el ratón, el pez cebra, el parásito de la malaria y las bacterias de la tuberculosis. Se han realizado muchas investigaciones importantes sobre estos organismos, y tener estas estructuras a disposición permitirá a muchos investigadores de campos muy diferentes, desde la neurociencia hasta la medicina, acelerar su trabajo.

La base de datos y el sistema de AlphaFold serán actualizados periódicamente a medida que se continúe invirtiendo en mejoras futuras de AlphaFold, y en los próximos meses se planea expandir enormemente la cobertura a casi todas las proteínas secuenciadas conocidas por la ciencia: más de 100 millones de estructuras que incluyen la mayoría de UniProt, la base de datos referencia.

(Fuente: EMBL)

Leído en NCyT

No hay comentarios.:

Publicar un comentario