Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español es
CORDIS - Resultados de investigaciones de la UE
CORDIS

Scalable Graph Algorithms for Bioinformatics using Structure, Parameterization and Dynamic Updates

Descripción del proyecto

Mejorar la escalabilidad de los algoritmos gráficos en bioinformática

Los progresos en las tecnologías de secuenciación, como la cartografía del genoma humano, han allanado el camino a descubrimientos revolucionarios. Sin embargo, a medida que crecen los volúmenes de datos, es necesario disponer de métodos computacionales fiables. El proyecto SCALEBIO, financiado por el Consejo Europeo de Investigación, pretende mejorar la escalabilidad de los algoritmos de grafos exactos mediante innovadoras estructuras de preprocesamiento de grafos y modernas técnicas algorítmicas. En concreto, introducirá estructuras de seguridad para simplificar la resolución de problemas mediante la identificación de caminos comunes en las soluciones óptimas, junto con estructuras de variación que se centran en ámbitos con una variación genética significativa. Las metodologías fundamentales incluirán algoritmos polinómicos parametrizados y algoritmos dinámicos que puedan adaptarse a nuevos datos. Las técnicas se aplicarán a ámbitos como el descubrimiento de transcritos de ARN de lectura larga y la indexación de grandes bases de datos genéticos.

Objetivo

Sequencing technologies have developed to be cheap and accurate, leading to major breakthroughs, such as the complete sequence of a human genome, the creation of nationwide population gene banks, or the discovery of novel viruses. As the amount of data produced grows exponentially and their applications become more broad and complex, the community needs accurate computational methods that scale.

At the core of many algorithmic methods for processing sequencing data is the basic primitive of finding a set of paths or walks in graphs of various nature. Under different formulations and objective functions, the resulting problems can be NP-hard (e.g. flow decompositions) or polynomial-time (e.g. path covers), which are impractical on large graphs. Thus, many practical tools prefer fast heuristics to exact algorithms. While these may be optimized for specific inputs, they may not be reliable or accurate in general, which is a highly relevant issue in e.g. medical and life-science research.

This project will develop general methods to massively scale such exact graph algorithms. First, via novel graph structures usable in a preprocessing step: safety structures, e.g. sets of paths that can be quickly found to appear in all optimal solutions and thus simplify the problem; variation structures that limit the hardness of a problem only to graph areas rich in genetic variation. Second, via modern algorithmic techniques: parameterizing polynomial algorithms to run in time linear in the graph size and superlinear only in a small parameter; dynamic algorithms that, as the input grows, update solutions based only on the new data.

We will apply these methods in two high-impact applications: long-read RNA transcript discovery, and indexing massive and rapidly growing genomic databases.

This project paves the way for exact graph algorithms usable independently of the problem complexity or of the input size, applicable to real-world problems.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo.
La clasificación de este proyecto ha sido validada por personas.

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC - HORIZON ERC Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2024-COG

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

HELSINGIN YLIOPISTO
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 1 999 868,00
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 1 999 868,00

Beneficiarios (1)

Mi folleto 0 0