Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Parallel Numerical Linear Algebra for Future Extreme-Scale Systems

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Rezultaty

Final prototype software for different versions of the BLAS (odnośnik otworzy się w nowym oknie)

Final implementation and evaluation of different versions of the BLAS based on the final specification from WP7.

Software for hybrid methods (odnośnik otworzy się w nowym oknie)

Software for partitioning saddle point problems and overdetermined systems; improved block Cimmino methods incorporating new solvers from other deliverables. Includes extensive testing, documentation and benchmarking.

Software integration (odnośnik otworzy się w nowym oknie)

Integration of the NLAFET library in the respective application environments.

Novel SVD algorithms (odnośnik otworzy się w nowym oknie)

Prototypes for the standard SVD algorithm, the symmetric eigenvalue problem and the QDWH-based SVD algorithm.

Software for highly unsymmetric factorizations (odnośnik otworzy się w nowym oknie)

Implementation of proposed methods from D3.4 on top of common task framework. Includes extensive testing, documentation and benchmarking.

Prototypes for tiled one-sided factorizations with algorithm-based fault tolerance (odnośnik otworzy się w nowym oknie)

Prototype software for the Cholesky, LU, and QR factorizations with algorithm-based fault tolerance described in D6.6.

Prototype software for eigenvalue problem solvers (odnośnik otworzy się w nowym oknie)

Prototypes for reduction to non-symmetric condensed forms (Hessenberg and Hessenberg-triangular), for the symmetric eigenvalue problem and the non-symmetric eigenvalue problems.

Prototype software, phase 2 (odnośnik otworzy się w nowym oknie)

Prototypes for Krylov-based iterative methods, and multilevel preconditioners.

Bidiagonal factorization (odnośnik otworzy się w nowym oknie)

Prototypes for tw-sided bidiagonal factorization.

Prototype software, phase 1 (odnośnik otworzy się w nowym oknie)

Prototype software for sparse matrix-matrix multiplication and sparse low-rank matrix- approximation.

Prototype software for different versions of the BLAS (odnośnik otworzy się w nowym oknie)

Implementation and evaluation of different versions of the BLAS based on the draft specification from WP7.

Software for symmetrically structured factorizations (odnośnik otworzy się w nowym oknie)

Implementation and adaption of methods from D3.2 on top of the common task framework. Extension from symmetric to unsymmetric (but symmetrically structured) case. Includes extensive testing, documentation and benchmarking.

Prototypes for runtime systems exhibiting novel types of scheduling (odnośnik otworzy się w nowym oknie)

Prototype for runtime systems capable of scheduling at a varying level of granularity/abstraction (i.e., basic kernels, BLAS, LAPACK, etc, and runtime systems that can execute the tasks along the critical path with an adaptive level of parallelism.

Algorithm design for symmetrically structured factorizations (odnośnik otworzy się w nowym oknie)

Report on algorithm design and approaches to address issues around use of DAGs for sparse factorizations. Includes reporting on prototype code testing possible solutions.

Scalability and tunability of factorization algorithms (odnośnik otworzy się w nowym oknie)

Report on scalability and tunability of the software implementing novel factorisation algorithms.

One-sided matrix factorizations (odnośnik otworzy się w nowym oknie)

Report on tile algorithms and new experimental algorithms for matrix factorizations (LU, Cholesky, symmetric indefinite and QR). Includes reporting on and documentation of prototype code developed.

Analysis and algorithm design (odnośnik otworzy się w nowym oknie)

Report on novel Krylov methods and multilevel preconditioners, focusing on numerical efficiency and theoretical properties.

Eigenvalue solvers for nonsymmetric problems (odnośnik otworzy się w nowym oknie)

Evaluation of new eigenvalue solvers for the non-symmetric eigenvalue problem, including Krylov methods.

Draft specification for Hybrid BLAS (odnośnik otworzy się w nowym oknie)

Requirements and draft specification for a common set of high performance linear algebra kernels on hybrid systems: Hybrid BLAS.

Evaluation of software prototypes (odnośnik otworzy się w nowym oknie)

Report evaluating the prototype software developed in task 6.1 with regard to overall system performance on a selection of linear algebra algorithms.

Integration (odnośnik otworzy się w nowym oknie)

Report on the integration of preconditioners and iterative methods from D4.3 into the NLAFET library. Evaluation of the parallel efficiency of the new preconditioned iterative solvers.

Algorithm design for highly unsymmetric factorizations (odnośnik otworzy się w nowym oknie)

Report on experimental algorithms for parallel Markowitz ordering, analyzing various approaches and highlighting issues arising. Includes reporting on prototype code testing possible algorithms and solutions.

Evaluation of auto-tuning techniques (odnośnik otworzy się w nowym oknie)

Report on the effect of applying the novel scheduling and auto-tuning prototypes to various linear algebra problems.

Novel methods for static and dynamic scheduling (odnośnik otworzy się w nowym oknie)

Evaluation of existing and novel methods for static and dynamic scheduling in various types of HPC systems. Includes documentation of algorithms and prototypes developed.

Requirements analysis (odnośnik otworzy się w nowym oknie)

Report describing the outcome of the requirements analysis for all applications.

First dissemination report (odnośnik otworzy się w nowym oknie)

Dissemination report for the first reporting period, M1-M18.

Dissemination and community outreach plan (odnośnik otworzy się w nowym oknie)

Plan for how to disseminate new results and interact with the broader community.

An off-line auto-tuning framework based on heuristic search (odnośnik otworzy się w nowym oknie)

Review of techniques for pruning the search space in the context of auto-tuning, resulting in prototypes for an offline auto-tuning framework based on heuristic search. Includes reporting on optimal circumstances for switching scheduling approaches at run-time.

Second dissemination report (odnośnik otworzy się w nowym oknie)

Final dissemination report, covering M19-M36.

Algorithm design for hybrid methods (odnośnik otworzy się w nowym oknie)

Report on partitioning techniques and performance bottlenecks for hybrid methods including block Cimmino. Analysis of methods for saddle-point and overdetermined systems.

Eigenvalue problem solvers (odnośnik otworzy się w nowym oknie)

Report on computation of eigenvectors and reordering of eigenvalues in Schur and generalized Schur forms. Includes evaluation of the scalability and tunability of the prototype software developed.

Theoretical bounds for communication in sparse operations (odnośnik otworzy się w nowym oknie)

Report on theoretical lower bounds for key sparse matrix operations such as matrix-matrix multiplication and factorization.

Performance evaluation (odnośnik otworzy się w nowym oknie)

Evaluation of the communication complexity and parallel performance of the prototypes from D4.3.

Final Hybrid BLAS specification (odnośnik otworzy się w nowym oknie)

Revised versions of the BLAS specification based on collaborations with academic institutions and hardware vendors.

Algorithm-based fault tolerance techniques (odnośnik otworzy się w nowym oknie)

Report on algorithm-based fault tolerance applied to the tiled Cholesky, LU, and/or QR factorizations.

Validation and evaluation (odnośnik otworzy się w nowym oknie)

Evaluation of the NLAFET library in the context of the applications, leading to validation of the library and recommendations for future improvements.

Collaborative infrastructure (odnośnik otworzy się w nowym oknie)

Project website (will contain both public parts, and parts that are restricted to the consortium), public and private source code repositories, bug tracking system, online forum, coding style, and developer guidelines.

Beta release of the NLAFET library (odnośnik otworzy się w nowym oknie)

Beta release of parts of the NLAFET library and User's Guide.

Release of the NLAFET library (odnośnik otworzy się w nowym oknie)

First complete release of the NLAFET library and associated User's Guide.

Publikacje

A synchronization-free algorithm for parallel sparse triangular solves. (odnośnik otworzy się w nowym oknie)

Autorzy: W. Liu , A. Li , J. Hogg, I. Duff, B Vinter
Opublikowane w: Proceedings of Euro-Par 2016, Springer Lecture Notes, Numer 9833, 2016, Strona(/y) 617-630, ISBN 978-3-319-43658-6
Wydawca: Springer Verlag
DOI: 10.1007/978-3-319-43659-3_45

Creating a Standardised Set of Batched BLAS Routines

Autorzy: Jack Dongarra and Sven Hammarling and Nicholas J. Higham and Samuel D. Relton and Pedro Valero-Lara and Mawussi Zounon
Opublikowane w: Proceedings of the Fourth Workshop on Sustainable Software for Science: Practice and Experiences (WSSSPE4, 2016), 2016
Wydawca: CEUR Workshop Proceedings

A 3D Parallel Algorithm for QR Decomposition (odnośnik otworzy się w nowym oknie)

Autorzy: Grey Ballard, James Demmel, Laura Grigori, Mathias Jacquelin, Nicholas Knight
Opublikowane w: Proceedings of the 30th on Symposium on Parallelism in Algorithms and Architectures - SPAA '18, 2018, Strona(/y) 55-65, ISBN 9781-450357999
Wydawca: ACM Press
DOI: 10.1145/3210377.3210415

An Auto-Tuning Framework for a NUMA-Aware Hessenberg Reduction Algorithm (odnośnik otworzy się w nowym oknie)

Autorzy: Mahmoud Eljammaly, Lars Karlsson, Bo Kågström
Opublikowane w: Companion of the 2018 ACM/SPEC International Conference on Performance Engineering - ICPE '18, 2018, Strona(/y) 5-8, ISBN 9781450356299
Wydawca: ACM Press
DOI: 10.1145/3185768.3186304

Harnessing GPU’s Tensor Cores for Fast FP16 Arithmetic to Speedup Mixed-Precision Iterative Refinement Solvers

Autorzy: Azzam Haidar, Stanimire Tomov, Jack Dongarra, Nick Higham
Opublikowane w: Proceedings of the International Conference for High Performance Computing, Networking, Storage, and Analysis, 2019
Wydawca: Association for Computing Machinery

Distributed One-Stage Hessenberg Triangular Reduction with Wavefront Scheduling

Autorzy: B. Adlerborn, L. Karlsson, and B. Kågström
Opublikowane w: NLAFET Working Papers, Numer 1, 2016
Wydawca: Umeå University, the NLAFET project

PDHGEQZ User Guide

Autorzy: B. Adlerborn, B. Kågström, D. Kressner
Opublikowane w: NLAFET Working Notes, Numer 2, 2016
Wydawca: Umeå University, NLAFET project

A Proposed API for Batched Basic Linear Algebra Subprograms

Autorzy: J. Dongarra, I. Duff, J Hogg, M. Gates, A. Haidar, S. Hammarling, N. J. Higham, P.V.-Lara, S.D. Relton, S. Tomov, M. Zounon
Opublikowane w: 2016, ISSN 1749-9097
Wydawca: University of Manchester

Experiments with sparse Cholesky using runtime systems

Autorzy: I. Duff, J. Hogg, and F. Lopez
Opublikowane w: NLAFET Working Notes, Numer 7, 2016
Wydawca: Umeå University, STFC

Workshop on Batched, Reproducible, and Reduced Precision BLAS

Autorzy: S. Hammarling
Opublikowane w: NLAFET Working Notes, Numer 4, 2016
Wydawca: Umeå University, University of Manchester

Low rank approximation of a sparse matrix based on LU factorization with column and row tournament pivoting

Autorzy: L. Grigori, S. Cayrols, and J. Demmel
Opublikowane w: NLAFET Working Notes, Numer 3, 2016
Wydawca: Umeå University, INRIA

A Comparison of Potential Interfaces for Batched BLAS Computations

Autorzy: S.D. Relton, P. Valero-Lara, and M. Zounon
Opublikowane w: NLAFET Working Notes, Numer 5, 2016
Wydawca: Umeå University, University of Manchester

A new sparse solver using a posteriori threshold pivoting

Autorzy: Jonathan Hogg
Opublikowane w: NLAFET Working Notes, Numer 6, 2016
Wydawca: Umeå University, STFC

Linear-time CUR approximation of BEM matrices

Autorzy: Ayala, Alan; Claeys, Xavier; Grigori, Laura
Opublikowane w: https://hal.inria.fr/hal-01893036, Numer 1, 2018
Wydawca: INRIA

A multilevel algebraic error estimator and the corresponding iterative solver with $p$-robust behavior

Autorzy: Miraçi, Ani; Papež, Jan; Vohralík, Martin
Opublikowane w: https://hal.archives-ouvertes.fr/hal-02070981, Numer 1, 2019
Wydawca: INRIA

Scalable Linear Solvers based on Enlarged Krylov subspaces with Dynamic Reduction of Search Directions

Autorzy: Laura Grigori, Olivier Tissot
Opublikowane w: 2018
Wydawca: INRIA

Reducing the communication and computational costs of enlarged Krylov subspaces conjugate gradient

Autorzy: Laura Grigori, Olivier Tissot
Opublikowane w: 2017
Wydawca: INRIA

A Multilevel Schwarz Preconditioner Based on a Hierarchy of Robust Coarse Spaces

Autorzy: Hussam Al Daas, Laura Grigori, Pierre Jolivet, Pierre-Henri Tournier
Opublikowane w: 2019
Wydawca: INRIA

Experiments with sparse Cholesky using a parametrized task graph implementation.

Autorzy: Iain Duff and Florent Lopez
Opublikowane w: NLAFET Working Notes, Numer 14, 2017
Wydawca: Umeå University, also as Technical Report RAL-TR-2017-006, Science & Technology Facilities Council, UK.

PLASMA 17 Functionality Report: Parallel BLAS and Norms, Linear Systems and Least Squares, Mixed Precision and Matrix Inversion

Autorzy: Maksims Abalenkovs, Jack Dongarra, Mark Gates, Azzam Haidar, Jakub Kurzak, Piotr Luszczek, Mawussi Zounon, Samuel Relton, Jakub Sistek, David Stevens, Ichitaro Yamazaki, Asim YarKhan
Opublikowane w: NLAFET Working Notes, Numer 15, 2017
Wydawca: Umeå University, also as LAPACK Working Notes 293

Solving linear equations with messenger-field and conjugate gradients techniques – an application to CMB data analysis

Autorzy: Jan Papez, Laura Grigori, Radoslav Stompor
Opublikowane w: NLAFET Working Notes, Numer 19, 2018
Wydawca: Umeå University. Also as INRIA Research Report 9157, France

Sparse direct solution on parallel computers

Autorzy: Iain Duff, Florent Lopez and Stojce Nakov
Opublikowane w: NLAFET Working Notes, Numer 17, 2017
Wydawca: Umeå University. Also published as Technical Report RAL-TR-2017-010, STFC, UK.

Parallelization of the solve phase in a task-based Cholesky solver using a sequential task flow model

Autorzy: Sébastien Cayrols, Iain Duff and Florent Lopez
Opublikowane w: NLAFET Working Notes, Numer 20, 2018
Wydawca: Umeå University. Also published as Technical Report RAL-TR-2018-008, STFC, UK

PLASMA 17 Performance Report. Linear Systems and Least Squares; Haswell, Knights Landing, POWER8.

Autorzy: Maksims Abalenkovs, Negin Bagherpour, Jack Dongarra, Mark Gates, Azzam Haidar, Jakub Kurzak, Piotr Luszczek, Samuel Relton, Jakub Sistek, David Stevens, PanruoWu, Ichitaro Yamazaki, Asim YarKhan, Mawussi Zounon
Opublikowane w: NLAFET Working Notes, Numer 16, 2017
Wydawca: Umeå university, also published as LAPACK Working Notes 292

An Auto-Tuning Framework for a NUMA-Aware Hessenberg Reduction Algorithm

Autorzy: Mahmoud Eljammaly, Lars Karlsson and Bo Kågström
Opublikowane w: NLAFET Working Notes, Numer 18, 2017
Wydawca: Umeå University

A new sparse symmetric indefinite solver using A Posteriori Threshold Pivoting

Autorzy: Iain Duff, Jonathan Hogg and Florent Lopez
Opublikowane w: NLAFET Working Notes, Numer 21, 2018
Wydawca: Umeå University. Also published as Technical Report RAL-TR-2018-012, STFC, UK

Design and implementation of a parallel Markowitz threshold algorithm

Autorzy: Timothy Davis, Iain Duff, Stojce Nakov
Opublikowane w: NLAFET Working Notes, Numer 22, 2019
Wydawca: Umeå University. Also published as Technical Report RAL-TR-2019-003, STFC, UK

Reducing the communication and computational costs of Enlarged Krylov subspaces Conjugate Gradient

Autorzy: L. Grigori and O. Tissot
Opublikowane w: NLAFET Working Note, Numer 13, 2017
Wydawca: Umeå University, also INRIA Research Report 9023

Evaluation of the Tunability of a New NUMA-Aware Hessenberg Reduction Algorithm

Autorzy: M. Eljammaly, L. Karlsson, and B. Kågström
Opublikowane w: NLAFET Working Notes, Numer 8, 2017
Wydawca: Umeå University, the NLAFET project

Second Workshop on Batched, Reproducible, and Reduced Precision BLAS.

Autorzy: Sven Hammarling
Opublikowane w: NLAFET Working Notes, Numer 12, 2017
Wydawca: Umeå University, University of Manchester

Towards Highly Parallel and Compute-Bound Computation of Eigenvectors of Matrices in Schur Form

Autorzy: B. Adlerborn, C.C. Kjelgaard Mikkelsen, L. Karlsson, and B. Kågström
Opublikowane w: NLAFET Working Notes, Numer 10, 2017
Wydawca: Umeå University, the NLAFET project

Robust solution of triangular linear systems

Autorzy: C.C. Kjelgaard Mikkelsen and L. Karlsson
Opublikowane w: NLAFET Working Notes, Numer 9, 2017
Wydawca: Umeå University

Task-Based Parallel Algorithms for Reordering of Matrices in Real Schur Form

Autorzy: M. Myllykoski, C.C. Kjelgaard Mikkelsen, L. Karlsson, and B. Kågström.
Opublikowane w: NLAFET Working Notes, Numer 11, 2017
Wydawca: Umeå University, the NLAFET project

Solving linear equations with messenger-field and conjugate gradient techniques: An application to CMB data analysis (odnośnik otworzy się w nowym oknie)

Autorzy: J. Papež, L. Grigori, R. Stompor
Opublikowane w: Astronomy & Astrophysics, Numer 620, 2018, Strona(/y) A59, ISSN 0004-6361
Wydawca: Springer Verlag
DOI: 10.1051/0004-6361/201832987

The Design and Performance of Batched BLAS on Modern High-Performance Computing Systems (odnośnik otworzy się w nowym oknie)

Autorzy: Jack Dongarra, Sven Hammarling, Nicholas J. Higham, Samuel D. Relton, Pedro Valero-Lara, Mawussi Zounon
Opublikowane w: Procedia Computer Science, Numer 108, 2017, Strona(/y) 495-504, ISSN 1877-0509
Wydawca: Elsevier
DOI: 10.1016/j.procs.2017.05.138

A Householder-Based Algorithm for Hessenberg-Triangular Reduction (odnośnik otworzy się w nowym oknie)

Autorzy: Zvonimir Bujanović, Lars Karlsson, Daniel Kressner
Opublikowane w: SIAM Journal on Matrix Analysis and Applications, Numer 39/3, 2018, Strona(/y) 1270-1294, ISSN 0895-4798
Wydawca: Society for Industrial and Applied Mathematics
DOI: 10.1137/17m1153637

Distributed One-Stage Hessenberg-Triangular Reduction with Wavefront Scheduling (odnośnik otworzy się w nowym oknie)

Autorzy: Björn Adlerborn, Lars Karlsson, Bo Kågström
Opublikowane w: SIAM Journal on Scientific Computing, Numer 40/2, 2018, Strona(/y) C157-C180, ISSN 1064-8275
Wydawca: Society for Industrial and Applied Mathematics
DOI: 10.1137/16m1103890

ALORA: Affine Low-Rank Approximations (odnośnik otworzy się w nowym oknie)

Autorzy: Alan Ayala, Xavier Claeys, Laura Grigori
Opublikowane w: Journal of Scientific Computing, Numer 79/2, 2019, Strona(/y) 1135-1160, ISSN 0885-7474
Wydawca: Kluwer Academic/Plenum Publishers
DOI: 10.1007/s10915-018-0885-5

PLASMA (odnośnik otworzy się w nowym oknie)

Autorzy: Jack Dongarra, Negin Bagherpour, Sven Hammarling, Jakub Šístek, David Stevens, Mawussi Zounon, Samuel D. Relton, Mark Gates, Azzam Haidar, Jakub Kurzak, Piotr Luszczek, Panruo Wu, Ichitaro Yamazaki, Asim Yarkhan, Maksims Abalenkovs
Opublikowane w: ACM Transactions on Mathematical Software, Numer 45/2, 2019, Strona(/y) 1-35, ISSN 0098-3500
Wydawca: Association for Computing Machinary, Inc.
DOI: 10.1145/3264491

Experiments with sparse Cholesky using a sequential task-flow implementation (odnośnik otworzy się w nowym oknie)

Autorzy: Iain Duff, Jonathan Hogg, Florent Lopez
Opublikowane w: Numerical Algebra, Control & Optimization, Numer 8/2, 2018, Strona(/y) 237-260, ISSN 2155-3297
Wydawca: American Institute of Mathematical Sciences
DOI: 10.3934/naco.2018014

A Guide for Achieving High Performance with Very Small Matrices on GPU: A Case Study of Batched LU and Cholesky Factorizations (odnośnik otworzy się w nowym oknie)

Autorzy: Azzam Haidar, Ahmad Abdelfattah, Mawussi Zounon, Stanimire Tomov, Jack Dongarra
Opublikowane w: IEEE Transactions on Parallel and Distributed Systems, Numer 29/5, 2018, Strona(/y) 973-984, ISSN 1045-9219
Wydawca: Institute of Electrical and Electronics Engineers
DOI: 10.1109/tpds.2017.2783929

Low Rank Approximation of a Sparse Matrix Based on LU Factorization with Column and Row Tournament Pivoting (odnośnik otworzy się w nowym oknie)

Autorzy: Laura Grigori, Sebastien Cayrols, James W. Demmel
Opublikowane w: SIAM Journal on Scientific Computing, Numer 40/2, 2018, Strona(/y) C181-C209, ISSN 1064-8275
Wydawca: Society for Industrial and Applied Mathematics
DOI: 10.1137/16m1074527

Parallel robust solution of triangular linear systems (odnośnik otworzy się w nowym oknie)

Autorzy: Carl Christian Kjelgaard Mikkelsen, Angelika Beatrix Schwarz, Lars Karlsson
Opublikowane w: Concurrency and Computation: Practice and Experience, 2017, Strona(/y) e5064, ISSN 1532-0626
Wydawca: John Wiley & Sons Inc.
DOI: 10.1002/cpe.5064

Fast synchronization-free algorithms for parallel sparse triangular solves with multiple right-hand sides (odnośnik otworzy się w nowym oknie)

Autorzy: Weifeng Liu, Ang Li, Jonathan D. Hogg, Iain S. Duff, Brian Vinter
Opublikowane w: Concurrency and Computation: Practice and Experience, Numer 29/21, 2017, Strona(/y) e4244, ISSN 1532-0626
Wydawca: John Wiley & Sons Inc.
DOI: 10.1002/cpe.4244

On solving separable block tridiagonal linear systems using a GPU implementation of radix-4 PSCR method (odnośnik otworzy się w nowym oknie)

Autorzy: M. Myllykoski, T. Rossi, J. Toivanen
Opublikowane w: Journal of Parallel and Distributed Computing, Numer 115, 2018, Strona(/y) 56-66, ISSN 0743-7315
Wydawca: Academic Press
DOI: 10.1016/j.jpdc.2018.01.004

Scalable eigenvector computation for the non-symmetric eigenvalue problem (odnośnik otworzy się w nowym oknie)

Autorzy: Angelika Schwarz, Lars Karlsson
Opublikowane w: Parallel Computing, Numer 85, 2019, Strona(/y) 131-140, ISSN 0167-8191
Wydawca: Elsevier BV
DOI: 10.1016/j.parco.2019.04.001

Symmetric Indefinite Linear Solver Using OpenMP Task on Multicore Architectures (odnośnik otworzy się w nowym oknie)

Autorzy: Ichitaro Yamazaki, Jakub Kurzak, Panruo Wu, Mawussi Zounon, Jack Dongarra
Opublikowane w: IEEE Transactions on Parallel and Distributed Systems, Numer 29/8, 2018, Strona(/y) 1879-1892, ISSN 1045-9219
Wydawca: Institute of Electrical and Electronics Engineers
DOI: 10.1109/tpds.2018.2808964

Optimized Batched Linear Algebra for Modern Architectures (odnośnik otworzy się w nowym oknie)

Autorzy: Jack Dongarra, Sven Hammarling, Nicholas J. Higham, Samuel D. Relton, Mawussi Zounon
Opublikowane w: Euro-Par 2017: Parallel Processing, Numer 10417, 2017, Strona(/y) 511-522, ISBN 978-3-319-64202-4
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-64203-1_37

Sparse Direct Solution on Parallel Computers (odnośnik otworzy się w nowym oknie)

Autorzy: Iain Duff, Florent Lopez, Stojce Nakov
Opublikowane w: Numerical Analysis and Optimization, Numer 235, 2018, Strona(/y) 67-98, ISBN 978-3-319-90025-4
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-90026-1_4

On the Tunability of a New Hessenberg Reduction Algorithm Using Parallel Cache Assignment (odnośnik otworzy się w nowym oknie)

Autorzy: Mahmoud Eljammaly, Lars Karlsson, Bo Kågström
Opublikowane w: Parallel Processing and Applied Mathematics, Numer 10777, 2018, Strona(/y) 579-589, ISBN 978-3-319-78023-8
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-78024-5_50

Experiments with Sparse Cholesky Using a Parametrized Task Graph Implementation (odnośnik otworzy się w nowym oknie)

Autorzy: Iain Duff, Florent Lopez
Opublikowane w: Parallel Processing and Applied Mathematics, Numer 10777, 2018, Strona(/y) 197-206, ISBN 978-3-319-78023-8
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-78024-5_18

The Design of Fast and Energy-Efficient Linear Solvers: On the Potential of Half-Precision Arithmetic and Iterative Refinement Techniques (odnośnik otworzy się w nowym oknie)

Autorzy: Azzam Haidar, Ahmad Abdelfattah, Mawussi Zounon, Panruo Wu, Srikara Pranesh, Stanimire Tomov, Jack Dongarra
Opublikowane w: Computational Science – ICCS 2018, Numer 10860, 2018, Strona(/y) 586-600, ISBN 978-3-319-93697-0
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-93698-7_45

Blocked Algorithms for Robust Solution of Triangular Linear Systems (odnośnik otworzy się w nowym oknie)

Autorzy: Carl Christian Kjelgaard Mikkelsen, Lars Karlsson
Opublikowane w: Parallel Processing and Applied Mathematics, Numer 10777, 2018, Strona(/y) 68-78, ISBN 978-3-319-78023-8
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-78024-5_7

A Task-Based Algorithm for Reordering the Eigenvalues of a Matrix in Real Schur Form (odnośnik otworzy się w nowym oknie)

Autorzy: Mirko Myllykoski
Opublikowane w: Parallel Processing and Applied Mathematics, Numer 10777, 2018, Strona(/y) 207-216, ISBN 978-3-319-78023-8
Wydawca: Springer International Publishing
DOI: 10.1007/978-3-319-78024-5_19

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0