Opis projektu
Wgląd do czarnej skrzynki algorytmów bayesowskich w celu analizy dużych zbiorów danych
Analiza bayesowska, czyli metoda wnioskowania statystycznego, w której stosuje się prawdopodobieństwo do aktualizowania naszej opinii o modelu na podstawie obserwacji, ma podstawowe znaczenie dla wielu algorytmów statystycznych i uczenia maszynowego na potrzeby dużych zbiorów danych. Pomaga ona zrozumieć procesy dotyczące złożonych problemów, na przykład w przypadku oceny zmiany klimatu czy śledzenia rozprzestrzeniania się chorób. Metody bayesowskie osiągają jednak swoje granice, jeśli chodzi o możliwości uwzględnienia olbrzymich ilości dostępnych danych, a próby przyspieszenia przetwarzania są w dużej mierze rozwiązaniami działającymi na zasadzie „czarnej skrzynki”, czyli takimi, których wewnętrzne mechanizmy nie są nam do końca znane. W ramach finansowanego przez UE projektu BigBayesUQ powstaje teoria skalowalnych metod bayesowskich umożliwiająca ilościowe określanie wydajności, ograniczeń i niepewności. Zwiększy ona dokładność takich metod, a także przyczyni się do ich upowszechnienia wśród naukowców i badaczy.
Cel
Recent years have seen a rapid increase in available information. This has created an urgent need for fast statistical and machine learning methods that can scale up to big data sets. Standard approaches, including the now routinely used Bayesian methods, are becoming computationally infeasible, especially in complex models with many parameters and large data sizes. A variety of algorithms have been proposed to speed up these procedures, but these are typically black box methods with very limited theoretical support. In fact empirical evidence shows the potentially bad performance of such methods. This is especially concerning in real-world applications, e.g. in medicine. In this project I shall open up the black box and provide a theory for scalable Bayesian methods combining recent, state-of-the-art techniques from Bayesian nonparametrics, empirical process theory, and machine learning. I focus on two very important classes of scalable techniques: variational and distributed Bayes. I shall establish guarantees, but also limitations, of these procedures for estimating the parameter of interest, and for quantifying the corresponding uncertainty, within a framework that will also convince outside of the Bayesian paradigm. As a result, scalable Bayesian techniques will have more accurate performance, and also better acceptance by a wider community of scientists and practitioners. The proposed research, although motivated by real world problems, is of a mathematical nature. In the analysis I consider mathematical models, which are routinely used in various fields (e.g. high-dimensional linear and logistic regressions are the work horses in econometrics or genetics). My theoretical results will provide principled new insights that can be used, for instance in multiple specific applications I am involved in, including developing novel statistical methods for understanding fundamental questions in cosmology and the early detection of dementia using multiple data sources.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Klasyfikacja tego projektu została potwierdzona przez zespół projektowy.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Klasyfikacja tego projektu została potwierdzona przez zespół projektowy.
- nauki przyrodniczeinformatykanauka o danychduże zbiory danych
- nauki przyrodniczematematykamatematyka stosowanastatystyka i rachunek prawdopodobieństwastatystyka bayesowska
- nauki przyrodniczeinformatykasztuczna inteligencjauczenie maszynowe
- nauki przyrodniczematematykamatematyka stosowanamodel matematyczny
Słowa kluczowe
Program(-y)
- HORIZON.1.1 - European Research Council (ERC) Main Programme
Temat(-y)
System finansowania
HORIZON-ERC - HORIZON ERC GrantsInstytucja przyjmująca
20136 Milano
Włochy