Skip to main content

STATISTICAL ANALYSIS OF PROTEIN SEQUENCES TO INFER 3D STRUCTURE AND FUNCTION

Article Category

Article available in the folowing languages:

Más información sobre la relación entre la secuencia, la estructura y la función de las proteínas

Un equipo de matemáticos y científicos de otras disciplinas aunaron fuerzas para descifrar las proteínas, componentes fundamentales de todos los seres vivos. Su análisis revolucionario llevado a cabo en el marco del proyecto europeo EVO-COUPLINGS podría acelerar el desarrollo de fármacos.

Economía digital
Investigación fundamental

Tras las moléculas de agua, las proteínas son las moléculas más abundantes en el organismo humano, pues componen tejidos como los músculos o el pelo. Son un componente básico de todos los organismos vivos y gracias a análisis computacionales nuevos dirigidos por la Dra. Lucy Colwell, beneficiaria de una beca Marie Curie, la ciencia podrá entenderlos mejor y desarrollar fármacos nuevos. Su equipo de matemáticos, químicos y bioquímicos en la Universidad de Cambridge descubrió relaciones entre las secuencias de proteínas, sus estructuras tridimensionales y su función. «Estos descubrimientos servirán de base para nuevas investigaciones. Las relaciones entre las secuencias proteicas y su estructura y función es una de las grandes incógnitas de nuestra era», afirma la Dra. Colwell, colaboradora del proyecto EVO-COUPLINGS. Los resultados de EVO-COUPLINGS facilitarán el descubrimiento de fármacos, pues su trabajo mejora la capacidad de predecir la estructura terciaria y los elementos de interacción de una proteína. La investigación, realizada con el apoyo del Programa Marie Curie, supuso un método innovador acogido con escepticismo en primera instancia. Esta primera impresión es ahora muy distinta. «Me emociona comprobar la popularidad de estas ideas —admite la doctora—. Antes de nuestro trabajo era mucho más difícil predecir la estructura de las proteínas y las interacciones a partir de las secuencias. Este método se está convirtiendo en un estándar en el sector y ha pasado a ser un componente fundamental de varios logros importantes recientes». Descodificar la matriz Los investigadores incluyeron en el equipo a matemáticos encargados de desarrollar métodos de teoría de matrices aleatorias, un método probabilístico desarrollado por físicos, para ayudar a los químicos y bioquímicos a analizar los datos de la secuencia proteica. Las técnicas experimentales de los últimos años han dado lugar a que los expertos dedicados a las ciencias naturales acaben recopilando una gran cantidad de datos científicos. Sin embargo, analizarlos todos para dar con los más útiles puede ser todo un quebradero de cabeza. «Mi trabajo es separar el polvo de la paja —afirmó la Dra. Colwell—. Para utilizar las secuencias de proteínas a fin de predecir la estructura, debimos antes identificar y eliminar el "ruido" en los datos provocado por la relación entre distintas proteínas. Es necesario "normalizar" los datos antes de crear los modelos matemáticos que permitan realizar predicciones útiles». Los analistas utilizan métodos de visualización de datos para ayudar a identificar estructuras en una serie de campos, métodos que pueden emplearse a continuación en cualquier tipo de datos. La Dra. Colwell colabora ahora con Google para aprovechar los progresos logrados en aprendizaje automático a fin de identificar patrones que sean difíciles de detectar para los humanos.

Palabras clave

EVO-COUPLINGS, proteínas, estructura proteica, secuencia, matriz aleatoria, aprendizaje automático

Descubra otros artículos del mismo campo de aplicación