Sequences of Sparse Matrix-Vector ...
Type de document :
Autre communication scientifique (congrès sans actes - poster - séminaire...): Communication dans un congrès avec actes
Titre :
Sequences of Sparse Matrix-Vector Multiplication on Fugaku’s A64FX processors
Auteur(s) :
Gurhem, Jérôme [Auteur]
Maison de la Simulation [MDLS]
Vandromme, Maxence [Auteur]
Maison de la Simulation [MDLS]
Tsuji, Miwako [Auteur]
RIKEN Center for Computational Science [Kobe] [RIKEN CCS]
Petiton, Serge [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Maison de la Simulation [MDLS]
Sato, Mitsuhisa [Auteur]
RIKEN Center for Computational Science [Kobe] [RIKEN CCS]
Maison de la Simulation [MDLS]
Vandromme, Maxence [Auteur]
Maison de la Simulation [MDLS]
Tsuji, Miwako [Auteur]
RIKEN Center for Computational Science [Kobe] [RIKEN CCS]
Petiton, Serge [Auteur]
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 [CRIStAL]
Maison de la Simulation [MDLS]
Sato, Mitsuhisa [Auteur]
RIKEN Center for Computational Science [Kobe] [RIKEN CCS]
Titre de la manifestation scientifique :
CLUSTER 2021 - IEEE International Conference on Cluster Computing
Ville :
Portland
Pays :
Etats-Unis d'Amérique
Date de début de la manifestation scientifique :
2021-09-07
Éditeur :
IEEE
Mot(s)-clé(s) en anglais :
Parallel computing
Distributed computing
matrix-vector multiplication
Sparse matrix
A64FX
Network on chip
Distributed computing
matrix-vector multiplication
Sparse matrix
A64FX
Network on chip
Discipline(s) HAL :
Informatique [cs]/Calcul parallèle, distribué et partagé [cs.DC]
Résumé en anglais : [en]
We implement parallel and distributed versions of the sparse matrix-vector product and the sequence of matrixvector product operations, using OpenMP, MPI, and the ARM SVE intrinsic functions, for different matrix storage ...
Lire la suite >We implement parallel and distributed versions of the sparse matrix-vector product and the sequence of matrixvector product operations, using OpenMP, MPI, and the ARM SVE intrinsic functions, for different matrix storage formats. We investigate the efficiency of these implementations on one and two A64FX processors, using a variety of sparse matrices as input. The matrices have different properties in size, sparsity and regularity. We observe that a parallel and distributed implementation shows good scaling on two nodes for cases where the matrix is close to a diagonal matrix, but the performances degrade quickly with variations to the sparsity or regularity of the input.Lire moins >
Lire la suite >We implement parallel and distributed versions of the sparse matrix-vector product and the sequence of matrixvector product operations, using OpenMP, MPI, and the ARM SVE intrinsic functions, for different matrix storage formats. We investigate the efficiency of these implementations on one and two A64FX processors, using a variety of sparse matrices as input. The matrices have different properties in size, sparsity and regularity. We observe that a parallel and distributed implementation shows good scaling on two nodes for cases where the matrix is close to a diagonal matrix, but the performances degrade quickly with variations to the sparsity or regularity of the input.Lire moins >
Langue :
Anglais
Comité de lecture :
Oui
Audience :
Internationale
Vulgarisation :
Non
Collections :
Source :
Fichiers
- https://hal.archives-ouvertes.fr/hal-03450283/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-03450283/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-03450283/document
- Accès libre
- Accéder au document
- https://hal.archives-ouvertes.fr/hal-03450283/document
- Accès libre
- Accéder au document
- document
- Accès libre
- Accéder au document
- paper.pdf
- Accès libre
- Accéder au document