Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Productive Spatial Accelerator Programming

CORDIS bietet Links zu öffentlichen Ergebnissen und Veröffentlichungen von HORIZONT-Projekten.

Links zu Ergebnissen und Veröffentlichungen von RP7-Projekten sowie Links zu einigen Typen spezifischer Ergebnisse wie Datensätzen und Software werden dynamisch von OpenAIRE abgerufen.

Veröffentlichungen

Low-Depth Spatial Tree Algorithms (öffnet in neuem Fenster)

Autoren: Yves Baumann, Tal Ben-Nun, Maciej Besta, Lukas Gianinazzi, Torsten Hoefler, Piotr Luczynski
Veröffentlicht in: 2024 IEEE International Parallel and Distributed Processing Symposium (IPDPS), 2024
Herausgeber: IEEE
DOI: 10.1109/ipdps57955.2024.00024

Network-Offloaded Bandwidth-Optimal Broadcast and Allgather for Distributed AI (öffnet in neuem Fenster)

Autoren: Mikhail Khalilov, Salvatore Di Girolamo, Marcin Chrapek, Rami Nudelman, Gil Bloch, Torsten Hoefler
Veröffentlicht in: SC24: International Conference for High Performance Computing, Networking, Storage and Analysis, 2024, Seite(n) 1-17
Herausgeber: IEEE
DOI: 10.1109/sc41406.2024.00109

High-Performance and Programmable Attentional Graph Neural Networks with Global Tensor Formulations (öffnet in neuem Fenster)

Autoren: Maciej Besta, Pawel Renc, Robert Gerstenberger, Paolo Sylos Labini, Alexandros Ziogas, Tiancheng Chen, Lukas Gianinazzi, Florian Scheidl, Kalman Szenes, Armon Carigiet, Patrick Iff, Grzegorz Kwasniewski, Raghavendra Kanakagiri, Chio Ge, Sammy Jaeger, Jarosław Wąs, Flavio Vella, Torsten Hoefler
Veröffentlicht in: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, 2024, Seite(n) 1-16
Herausgeber: ACM
DOI: 10.1145/3581784.3607067

Productive Performance Engineering for Weather and Climate Modeling with Python (öffnet in neuem Fenster)

Autoren: Ben-Nun, Tal; Groner, Linus; Deconinck, Florian; Wicky, Tobias; Davis, Eddie; Dahm, Johann; Elbert, Oliver D.; George, Rhea; McGibbon, Jeremy; Trümper, Lukas; Wu, Elynn; Fuhrer, Oliver; Schulthess, Thomas; Hoefler, Torsten
Veröffentlicht in: SC'22: Proceedings of the International Conference on High Performance Computing, Networking, Storage and Analysis, Ausgabe 1, 2022
Herausgeber: SC
DOI: 10.1109/sc41404.2022.00078

Bridging Control-Centric and Data-Centric Optimization (öffnet in neuem Fenster)

Autoren: Tal Ben-Nun; Berke Ates; Alexandru Calotoiu; Torsten Hoefler
Veröffentlicht in: 2023
Herausgeber: 21st ACM/IEEE International Symposium on Code Generation and Optimization
DOI: 10.1145/3579990.3580018

VENOM: A Vectorized N:M Format for Unleashing the Power of Sparse Tensor Cores (öffnet in neuem Fenster)

Autoren: Roberto L. Castro, Andrei Ivanov, Diego Andrade, Tal Ben-Nun, Basilio B. Fraguela, Torsten Hoefler
Veröffentlicht in: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, 2024, Seite(n) 1-14
Herausgeber: ACM
DOI: 10.1145/3581784.3607087

User-guided Page Merging for Memory Deduplication in Serverless Systems (öffnet in neuem Fenster)

Autoren: Wei Qiu, Marcin Copik, Yun Wang, Alexandru Calotoiu, Torsten Hoefler
Veröffentlicht in: 2023 IEEE International Conference on Big Data (BigData), 2024, Seite(n) 159-169
Herausgeber: IEEE
DOI: 10.1109/bigdata59044.2023.10386487

HexaMesh: Scaling to Hundreds of Chiplets with an Optimized Chiplet Arrangement (öffnet in neuem Fenster)

Autoren: Iff, Patrick; Besta, Maciej; Cavalcante, Matheus; Fischer, Tim; Benini, Luca; Hoefler, Torsten
Veröffentlicht in: Ausgabe 1, 2023
Herausgeber: 60th Annual Design Automation Conference
DOI: 10.48550/arxiv.2211.13989

HammingMesh: A Network Topology for Large-Scale Deep Learning (öffnet in neuem Fenster)

Autoren: T. Hoefler, T. Bonato, D. De Sensi, S. Di Girolamo, S. Li, M. Heddes, J. Belk, D. Goel, M. Castro, S. Scott
Veröffentlicht in: 2022
Herausgeber: International Conference for High Performance Computing, Networking, Storage and Analysis
DOI: 10.48550/arxiv.2209.01346

Sparse Hamming Graph: A Customizable Network-on-Chip Topology (öffnet in neuem Fenster)

Autoren: P. Iff, M. Besta, M. Cavalcante, T. Fischer, L. Benini, T. Hoefler
Veröffentlicht in: 2023
Herausgeber: 60th Annual Design Automation Conference
DOI: 10.48550/arxiv.2211.13980

KafkaDirect: Zero-copy Data Access for Apache Kafka over RDMA Networks (öffnet in neuem Fenster)

Autoren: K. Taranov, S. Byan, V. Marathe, T. Hoefler
Veröffentlicht in: 2022
Herausgeber: ACM SIGMOD International Conference on Management of Data
DOI: 10.1145/3514221.3526056

Performance-detective (öffnet in neuem Fenster)

Autoren: Larissa Schmid, Marcin Copik, Alexandru Calotoiu, Dominik Werle, Andreas Reiter, Michael Selzer, Anne Koziolek, Torsten Hoefler
Veröffentlicht in: Proceedings of the 36th ACM International Conference on Supercomputing, 2023, Seite(n) 1-13
Herausgeber: ACM
DOI: 10.1145/3524059.3532391

ProbGraph: High-Performance and High-Accuracy Graph Mining with Probabilistic Set Representations (öffnet in neuem Fenster)

Autoren: M. Besta, C. Miglioli, P. Sylos Labini, J. Tětek, P. Iff, R. Kanakagiri, S. Ashkboos, K. Janda, M. Podstawski, G. Kwasniewski, N. Gleinig, F. Vella, O. Mutlu, T. Hoefler
Veröffentlicht in: 2022
Herausgeber: SC'22
DOI: 10.48550/arxiv.2208.11469

DiffDA: a Diffusion model for weather-scale Data Assimilation

Autoren: Langwen Huang, Lukas Gianinazzi, Yuejiang Yu, Peter D. Dueben, Torsten Hoefler
Veröffentlicht in: DiffDA, 2024
Herausgeber: ICML

Boosting Performance Optimization with Interactive Data Movement Visualization (öffnet in neuem Fenster)

Autoren: P. Schaad, T. Ben-Nun, T. Hoefler
Veröffentlicht in: 2022
Herausgeber: SC'22
DOI: 10.1109/sc41404.2022.00069

STen: An Interface for Efficient Sparsity in PyTorch (öffnet in neuem Fenster)

Autoren: A. Ivanov, N. Dryden, T. Hoefler
Veröffentlicht in: 2022
Herausgeber: In Sparsity in Neural Networks workshop
DOI: 10.48550/arxiv.2304.07613

Process-as-a-Service: Unifying Elastic and Stateful Clouds with Serverless Processes (öffnet in neuem Fenster)

Autoren: Marcin Copik, Alexandru Calotoiu, Gyorgy Rethy, Roman Böhringer, Rodrigo Bruno, Torsten Hoefler
Veröffentlicht in: Proceedings of the ACM Symposium on Cloud Computing, 2024, Seite(n) 223-242
Herausgeber: ACM
DOI: 10.1145/3698038.3698567

automatic deduction of cheap and accurate performance models (öffnet in neuem Fenster)

Autoren: Larissa Schmid; Marcin Copik; Alexandru Calotoiu; Dominik Werle; Andreas Reiter; Michael Selzer; Anne Koziolek; Torsten Hoefler
Veröffentlicht in: ICS '22: Proceedings of the 36th ACM International Conference on Supercomputing, Ausgabe 1, 2022
Herausgeber: ICS'22
DOI: 10.5445/ir/1000146623

The Graph Database Interface: Scaling Online Transactional and Analytical Graph Workloads to Hundreds of Thousands of Cores (öffnet in neuem Fenster)

Autoren: Maciej Besta, Robert Gerstenberger, Marc Fischer, Michal Podstawski, Nils Blach, Berke Egeli, Georgy Mitenkov, Wojciech Chlapek, Marek Michalewicz, Hubert Niewiadomski, Juergen Mueller, Torsten Hoefler
Veröffentlicht in: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, 2024, Seite(n) 1-18
Herausgeber: ACM
DOI: 10.1145/3581784.3607068

Streaming Task Graph Scheduling for Dataflow Architectures (öffnet in neuem Fenster)

Autoren: Tiziano De Matteis, Lukas Gianinazzi, Johannes de Fine Licht, Torsten Hoefler
Veröffentlicht in: Proceedings of the 32nd International Symposium on High-Performance Parallel and Distributed Computing, 2024, Seite(n) 225-237
Herausgeber: ACM
DOI: 10.1145/3588195.3592999

Deinsum: Practically I/O Optimal Multilinear Algebra (öffnet in neuem Fenster)

Autoren: A. Nikolaos Ziogas, G. Kwasniewski, T. Ben-Nun, T. Schneider, T. Hoefler
Veröffentlicht in: 2022
Herausgeber: SC'22
DOI: 10.48550/arxiv.2206.08301

Asynchronous Distributed-Memory Triangle Counting and LCC with RMA Caching (öffnet in neuem Fenster)

Autoren: Andras Strausz; Flavio Vella; Salvatore Di Girolamo; Maciej Besta; Torsten Hoefler
Veröffentlicht in: 2022 IEEE International Parallel and Distributed Processing Symposium (IPDPS), Ausgabe 2, 2022
Herausgeber: IEEE
DOI: 10.48550/arxiv.2202.13976

A data-centric optimization framework for machine learning (öffnet in neuem Fenster)

Autoren: Rausch, Oliver; Ben-Nun, Tal; Dryden, Nikoli; Ivanov, Andrei; Li, Shigang; Hoefler, Torsten
Veröffentlicht in: Proceedings of the 36th ACM International Conference on Supercomputing, Ausgabe 7, 2022
Herausgeber: ACM International Conference on Supercomputing
DOI: 10.48550/arxiv.2110.10802

Maximum Flows in Parametric Graph Templates (öffnet in neuem Fenster)

Autoren: T. Ben-Nun, L. Gianinazzi, T. Hoefler, Y. Oltchik
Veröffentlicht in: 2023
Herausgeber: In Algorithms and Complexity - 13th International Conference
DOI: 10.48550/arxiv.2307.08420

Near-Optimal Wafer-Scale Reduce (öffnet in neuem Fenster)

Autoren: Piotr Luczynski, Lukas Gianinazzi, Patrick Iff, Leighton Wilson, Daniele De Sensi, Torsten Hoefler
Veröffentlicht in: Proceedings of the 33rd International Symposium on High-Performance Parallel and Distributed Computing, 2024, Seite(n) 334-347
Herausgeber: ACM
DOI: 10.1145/3625549.3658693

High Performance Unstructured SpMM Computation Using Tensor Cores (öffnet in neuem Fenster)

Autoren: Patrik Okanovic, Grzegorz Kwasniewski, Paolo Sylos Labini, Maciej Besta, Flavio Vella, Torsten Hoefler
Veröffentlicht in: SC24: International Conference for High Performance Computing, Networking, Storage and Analysis, 2024, Seite(n) 1-14
Herausgeber: IEEE
DOI: 10.1109/sc41406.2024.00060

FMI: Fast and Cheap Message Passing for Serverless Functions (öffnet in neuem Fenster)

Autoren: Marcin Copik, Roman Böhringer, Alexandru Calotoiu, Torsten Hoefler
Veröffentlicht in: Proceedings of the 37th International Conference on Supercomputing, 2023, Seite(n) 373-385
Herausgeber: ACM
DOI: 10.1145/3577193.3593718

Lifting C semantics for dataflow optimization (öffnet in neuem Fenster)

Autoren: Alexandru Calotoiu; Tal Ben-Nun; Grzegorz Kwasniewski; Johannes de Fine Licht; Timo Schneider; Philipp Schaad; Torsten Hoefler
Veröffentlicht in: Proceedings of the 36th ACM International Conference on Supercomputing, Ausgabe 1, 2022
Herausgeber: 36th ACM International Conference on Supercomputing
DOI: 10.1145/3524059.3532389

Deep learning and a changing economy in weather and climate prediction (öffnet in neuem Fenster)

Autoren: Peter Bauer, Peter Dueben, Matthew Chantry, Francisco Doblas-Reyes, Torsten Hoefler, Amy McGovern, Bjorn Stevens
Veröffentlicht in: Nature Reviews Earth & Environment, Ausgabe 4, 2023, Seite(n) 507-509, ISSN 2662-138X
Herausgeber: Springer Nature
DOI: 10.1038/s43017-023-00468-z

Graph of Thoughts: Solving Elaborate Problems with Large Language Models (öffnet in neuem Fenster)

Autoren: Maciej Besta, Nils Blach, Ales Kubicek, Robert Gerstenberger, Michal Podstawski, Lukas Gianinazzi, Joanna Gajda, Tomasz Lehmann, Hubert Niewiadomski, Piotr Nyczyk, Torsten Hoefler
Veröffentlicht in: Proceedings of the AAAI Conference on Artificial Intelligence, Ausgabe 38, 2024, Seite(n) 17682-17690, ISSN 2374-3468
Herausgeber: AAAI Press
DOI: 10.1609/aaai.v38i16.29720

Influence of Network Performance Variability on Application Scalability (öffnet in neuem Fenster)

Autoren: Daniele De Sensi; Tiziano De Matteis; Konstantin Taranov; Salvatore Di Girolamo; Tobias Rahn; Torsten Hoefler
Veröffentlicht in: Proceedings of the ACM on Measurement and Analysis of Computing Systems, 6 (3), Ausgabe 1, 2022, ISSN 0000-0000
Herausgeber: Proc. ACM Meas. Anal. Comput. Syst.. Vol 6, Nr. 3, Association for Computing Machinery, Dec. 2022)
DOI: 10.1145/3570609

FMI: Fast and Cheap Message Passing for Serverless Functions (öffnet in neuem Fenster)

Autoren: M. Copik, R. Böhringer, A. Calotoiu, T. Hoefler
Veröffentlicht in: 2023
Herausgeber: ICS
DOI: 10.48550/arxiv.2305.08763

Suche nach OpenAIRE-Daten ...

Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten

Es liegen keine Ergebnisse vor

Mein Booklet 0 0