Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Inference in High Dimensions: Light-speed Algorithms and Information Limits

Opis projektu

Tworzenie algorytmów wnioskowania na podstawie danych wielowymiarowych

Zaawansowana technologia obliczeniowa pozwala na zbieranie i przechowywanie ogromnych ilości danych. Jednak w wielu zastosowaniach naukowych, w których zarówno dane, jak i uczenie maszynowe mają charakter wielowymiarowy, coraz trudniej jest interpretować informacje i wyciągać poprawne wnioski przy użyciu klasycznej teorii statystycznej. Problem ten jest szczególnie widoczny w przypadku medycyny. Chcąc temu zaradzić, zespół finansowanego przez Europejską Radę ds. Badań Naukowych projektu INF_2 zamierza stworzyć ramy teoretyczne dla wnioskowania wielowymiarowego w uczeniu maszynowym i nauce o danych. W tym celu przy pomocy metody pola średniego naukowcy określą podstawowe ograniczenia dla wnioskowania (minimalne wymagania dotyczące danych), a także opracują algorytmy, które wykazują skuteczność przy minimalnej ilości danych. Zasady te zostaną następnie dostosowane do rzeczywistych zastosowań w badaniach asocjacyjnych całego genomu.

Cel

Extracting information from data is the key challenge of our time, and in many applications (e.g. genome-wide association studies, data compression, and virtual assistants such as ChatGPT) both the data and the machine learning model used to extract information are increasingly high-dimensional. As traditional statistical theory is ill-equipped to face this explosion in the dimensionality of the problem, machine learning is now predominantly experimental. However, empirical approaches come with huge costs affordable only to large companies, and they lack interpretability, which is especially troublesome in medical applications. To address these issues, the INF^2 project develops information-theoretically principled methods for high-dimensional inference in machine learning and data science. The key insight is that, via a “mean-field” approach, high-dimensional quantities are well approximated by low-dimensional ones and then characterized exactly. Leveraging this characterization, we will (i) establish the fundamental limits of inference, i.e. the minimal amount of data necessary to solve the problem, and (ii) design efficient algorithms requiring only the minimal amount of data. The challenge we tackle is to apply this paradigm to practical settings, in which data are structured and heterogeneous (as in genome-wide association studies), and models consist of complex architectures tailored to applications (auto-encoders for data compression, and transformers for ChatGPT). Through a novel analysis of spectral methods, approximate message passing and gradient descent, INF^2 builds a theoretical framework having conceptual impact, as well as vast applicability, in machine learning and information theory. This framework is then brought to the real world via applications in genome-wide association studies. Broadly, our results enable the principled design of machine learning algorithms and models, drastically reducing costs and providing interpretable solutions.

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

HORIZON-ERC - HORIZON ERC Grants

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) ERC-2024-STG

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Instytucja przyjmująca

INSTITUTE OF SCIENCE AND TECHNOLOGY AUSTRIA
Wkład UE netto

Kwota netto dofinansowania ze środków Unii Europejskiej. Suma środków otrzymanych przez uczestnika, pomniejszona o kwotę unijnego dofinansowania przekazanego powiązanym podmiotom zewnętrznym. Uwzględnia podział unijnego dofinansowania pomiędzy bezpośrednich beneficjentów projektu i pozostałych uczestników, w tym podmioty zewnętrzne.

€ 1 662 400,00
Adres
Am Campus 1
3400 KLOSTERNEUBURG
Austria

Zobacz na mapie

Region
Ostösterreich Niederösterreich Wiener Umland/Nordteil
Rodzaj działalności
Higher or Secondary Education Establishments
Linki
Koszt całkowity

Ogół kosztów poniesionych przez organizację w związku z uczestnictwem w projekcie. Obejmuje koszty bezpośrednie i pośrednie. Kwota stanowi część całkowitego budżetu projektu.

€ 1 662 400,00

Beneficjenci (1)

Moja broszura 0 0