Descrizione del progetto
Comprendere e prevedere i dati di serie temporali
Le serie temporali caratterizzano diversi sistemi che possono variare dal movimento dei protoni al tasso di cambio dollaro/yen. Per comprendere, confrontare, classificare e prevedere i dati di serie temporali si utilizzano generalmente le equazioni differenziali stocastiche, diversi modelli di passeggiata aleatoria ( ) e algoritmi di apprendimento automatico che, però, lasciano senza risposta domande fondamentali. Per superare questo problema, il progetto NoMaMemo, finanziato dall’UE, si propone di creare una piattaforma generica per analizzare, comprendere, confrontare, classificare e prevedere i dati delle serie temporali e ottimizzare i sistemi stocastici. Il progetto fornirà una descrizione unificata dei dati generici delle serie temporali in termini di equazioni integro-differenziali stocastiche non lineari basate su funzioni di memoria estratte dai dati. Grazie al suo approccio, il progetto farà progredire in modo significativo la comprensione di molteplici sistemi e processi scientifici.
Obiettivo
Time series characterize diverse systems, examples in this proposal are: i) Proton motion in an inhomogeneous aqueous environment, ii) folding and unfolding of a peptide described by a suitably chosen reaction coordinate, iii) migration of a living cell on a substrate, iv) US Dollar / Yen exchange rate. Examples i) and ii) are close-to-equilibrium, iii) is a far from equilibrium since energy is constantly dissipated, while example iv) at first sight defies the classification into equilibrium or non-equilibrium.
For the understanding, comparison, classification and forecasting of time series data, stochastic differential equations, diverse random walk models, and more recently, machine-learning algorithms are commonly used. But fundamental questions remain unanswered: Is a unified description of such diverse systems possible? What is the relation between different proposed models? Can the non-equilibrium degree of a time series be estimated?
NoMaMemo provides a unified description of generic time series data in terms of non-linear integro-differential stochastic equations based on memory functions that are extracted from data. NoMaMemo accounts for non-linear and non-equilibrium effects as well as for non-Gaussian noise and connects with fundamental concepts such as equilibrium statistical mechanics, response theory and entropy production. The general formulation contains previously proposed models and thus allows their comparison, forecasting quality will be compared with modern machine-learning algorithms. NoMaMemo creates a generic platform to analyse, understand, compare, classify and predict time series data and to optimize stochastic systems with respect to search efficiency, barrier-crossing speed or other figures of merit. NoMaMemo will significantly advance the understanding of chemical reaction and protein folding kinetics, the interpretation of THz and IR spectroscopy of liquids and the analysis of living matter and socio-economic data.
Campo scientifico
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
- natural sciencesmathematicspure mathematicsmathematical analysisdifferential equations
- natural sciencesmathematicsapplied mathematicsdynamical systems
- natural sciencesbiological sciencesbiochemistrybiomoleculesproteinsprotein folding
- natural sciencesphysical sciencesclassical mechanicsstatistical mechanics
- natural sciencescomputer and information sciencesartificial intelligencemachine learning
Parole chiave
Programma(i)
Argomento(i)
Meccanismo di finanziamento
ERC-ADG - Advanced GrantIstituzione ospitante
14195 Berlin
Germania