Projektbeschreibung
Zeitreihendaten verstehen und voraussagen
Zeitreihen charakterisieren verschiedene Systeme von der Protonenbewegung bis zum Wechselkurs von Dollar und Yen. Um Zeitreihendaten zu verstehen, zu vergleichen, zu klassifizieren und vorherzusagen, werden in der Regel stochastische Differentialgleichungen, verschiedene Random-Walk-Modelle und maschinelle Lernalgorithmen genutzt. Grundsätzliche Fragen bleiben dabei jedoch unbeantwortet. Das EU-finanzierte Projekt NoMaMemo möchte dieses Problem mithilfe einer generischen Plattform überwinden, über die sich Zeitreihendaten analysieren, verstehen, vergleichen, klassifizieren und voraussagen sowie stochastische Systeme optimieren lassen. Es wird eine einheitliche Beschreibung generischer Zeitreihendaten im Sinne nichtlinearer stochastischer Integro-Differentialgleichungen auf der Basis von Speicherfunktionen bieten, die aus Daten extrahiert wurden. Dadurch wird das Projekt das Verständnis verschiedener wissenschaftlicher Systeme und Prozesse deutlich fördern.
Ziel
Time series characterize diverse systems, examples in this proposal are: i) Proton motion in an inhomogeneous aqueous environment, ii) folding and unfolding of a peptide described by a suitably chosen reaction coordinate, iii) migration of a living cell on a substrate, iv) US Dollar / Yen exchange rate. Examples i) and ii) are close-to-equilibrium, iii) is a far from equilibrium since energy is constantly dissipated, while example iv) at first sight defies the classification into equilibrium or non-equilibrium.
For the understanding, comparison, classification and forecasting of time series data, stochastic differential equations, diverse random walk models, and more recently, machine-learning algorithms are commonly used. But fundamental questions remain unanswered: Is a unified description of such diverse systems possible? What is the relation between different proposed models? Can the non-equilibrium degree of a time series be estimated?
NoMaMemo provides a unified description of generic time series data in terms of non-linear integro-differential stochastic equations based on memory functions that are extracted from data. NoMaMemo accounts for non-linear and non-equilibrium effects as well as for non-Gaussian noise and connects with fundamental concepts such as equilibrium statistical mechanics, response theory and entropy production. The general formulation contains previously proposed models and thus allows their comparison, forecasting quality will be compared with modern machine-learning algorithms. NoMaMemo creates a generic platform to analyse, understand, compare, classify and predict time series data and to optimize stochastic systems with respect to search efficiency, barrier-crossing speed or other figures of merit. NoMaMemo will significantly advance the understanding of chemical reaction and protein folding kinetics, the interpretation of THz and IR spectroscopy of liquids and the analysis of living matter and socio-economic data.
Wissenschaftliches Gebiet
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht.
- natural sciencesmathematicspure mathematicsmathematical analysisdifferential equations
- natural sciencesmathematicsapplied mathematicsdynamical systems
- natural sciencesbiological sciencesbiochemistrybiomoleculesproteinsprotein folding
- natural sciencesphysical sciencesclassical mechanicsstatistical mechanics
- natural sciencescomputer and information sciencesartificial intelligencemachine learning
Schlüsselbegriffe
Programm/Programme
Thema/Themen
Finanzierungsplan
ERC-ADG - Advanced GrantGastgebende Einrichtung
14195 Berlin
Deutschland