講演抄録/キーワード |
講演名 |
2023-12-05 17:40
疎行列密ベクトル積の高速化のための非ゼロ要素位置辞書圧縮を適用した疎行列格納形式のGPUにおける形式変換の評価 ○村上 舜(北陸先端大)・米田一徳・岩村 尚・渡邉正宏(富士通Japan)・井口 寧(北陸先端大) CPSY2023-31 |
抄録 |
(和) |
近年,数値シミュレーションの複雑化および大規模化に伴い,数百万行を超える規模の行列の要素の多くが0である疎行列を係数行列とした連立一次方程式を高速に求解することが求められている.その求解には係数行列の変形が伴わない反復解法が用いられることが多く,主要な計算時間を占める疎行列密ベクトル積(sparse matrix vector products:SpMV)を高速化するために,CPUと比較して高速なメモリ帯域をもつGPUを活用することにより高速化が図られてきた.大規模な疎行列を,GPUの少ないデバイスメモリへ格納するにあたり,メモリ効率のよいCSR形式が多く用られている.また,メモリアクセスパターンを改善し高速にSpMVの計算が可能なSELL-C-σ形式が提案されているが,さらなるSpMVの高速化のためには,メモリへのアクセス回数を減らす必要がある.そのため第190回HPC研究会で,非ゼロ要素位置へ辞書圧縮を適用し,メモリへのアクセスを減らすことによって,GPU上でSpMVを高速に計算可能な非ゼロ要素位置辞書圧縮疎行列格納形式を提案した.これによってCSR形式と比較して最大19.6%の高速化が得られた.これらの改善された格納形式は,SpMVの計算時間は高速化されるが,各形式への変換時間というオーバーヘッドが発生する.本論文ではCSR形式,SELL-C-σ形式および第190回HPC研究会で提案した非ゼロ要素位置辞書圧縮疎行列格納形式について,それぞれCPUおよびGPU上での形式変換時間を評価することによって,形式変換のオーバーヘッドを含めたSpMV計算高速化の評価を行う. |
(英) |
In recent years, as numerical simulations have become increasingly complex and large-scale. There is a growing demand for fast computation of linear systems with sparse matrices whose almost elements are mostly zeros and whose have more than several million rows. Iterative methods that do not deform the coefficient matrices are often used to solve these equations. And GPUs, which have faster memory bandwidth than CPUs, have been used to accelerate sparse matrix vector products (SpMV), which take up a major part of the computation time. GPUs have been used to accelerate the sparse matrix-vector multiplication (SpMV). In storing a large sparse matrice to the limited device memory of GPUs, the memory-efficient CSR format is well used. In addtion, SELL-C-σ format has been proposed to improve the memory access pattern and enable fast SpMV computation. Therefore, at the 190th HPC conference, we proposed a non-zero element position dictionary compressing sparse matrix format that can compute SpMV faster on GPUs by applying dictionary compression to non-zero element indices and reducing memory accesses. The proposed storage format is up to 19.6% faster than the CSR format. Although these improved formats speed up the time of SpMV, they cause the overhead of format conversion time. In this paper, we evaluate the SpMV speedup, including the overhead of format conversion, about the CSR format, the SELL-C-σ format, and the proposed non-zero element indices dictionary compressed sparse matrix format on CPU and GPU. |
キーワード |
(和) |
疎行列密ベクトル積 / GPU / 疎行列格納形式 / / / / / |
(英) |
Sparse Matrix-Vector multiplication / GPU / Sparse Matrix Format / / / / / |
文献情報 |
信学技報, vol. 123, no. 293, CPSY2023-31, pp. 25-30, 2023年12月. |
資料番号 |
CPSY2023-31 |
発行日 |
2023-11-28 (CPSY) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2023-31 |
研究会情報 |
研究会 |
CPSY IPSJ-ARC IPSJ-HPC |
開催期間 |
2023-12-05 - 2023-12-06 |
開催地(和) |
沖縄産業支援センター |
開催地(英) |
Okinawa Industry Support Center |
テーマ(和) |
コンピュータシステム, HPC, 一般 |
テーマ(英) |
Computer Systems, HPC, etc. |
講演論文情報の詳細 |
申込み研究会 |
CPSY |
会議コード |
2023-12-CPSY-ARC-HPC |
本文の言語 |
日本語 |
タイトル(和) |
疎行列密ベクトル積の高速化のための非ゼロ要素位置辞書圧縮を適用した疎行列格納形式のGPUにおける形式変換の評価 |
サブタイトル(和) |
|
タイトル(英) |
Evaluation of conversion overheads for the sparse matrix format appliying indices of the non-zero elements dictionary compression to accelerate SpMV on GPU |
サブタイトル(英) |
|
キーワード(1)(和/英) |
疎行列密ベクトル積 / Sparse Matrix-Vector multiplication |
キーワード(2)(和/英) |
GPU / GPU |
キーワード(3)(和/英) |
疎行列格納形式 / Sparse Matrix Format |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
村上 舜 / Shun Murakami / ムラカミ シュン |
第1著者 所属(和/英) |
北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Science and Technolog (略称: JAIST) |
第2著者 氏名(和/英/ヨミ) |
米田 一徳 / Kazunori Yoneda / ヨネダ カズノリ |
第2著者 所属(和/英) |
富士通Japan株式会社 ソリューション開発本部 部門ソリューション事業部 (略称: 富士通Japan)
Section Solutions Div., , Solutions Development Unit, Fujitsu Japan Limited (略称: Fujitsu Japan) |
第3著者 氏名(和/英/ヨミ) |
岩村 尚 / Iwamura Takashi / イワムラ タカシ |
第3著者 所属(和/英) |
富士通Japan株式会社 ソリューション開発本部 部門ソリューション事業部 (略称: 富士通Japan)
Section Solutions Div., , Solutions Development Unit, Fujitsu Japan Limited (略称: Fujitsu Japan) |
第4著者 氏名(和/英/ヨミ) |
渡邉 正宏 / Masahiro Watanabe / ワタナベ マサヒロ |
第4著者 所属(和/英) |
富士通Japan株式会社 ソリューション開発本部 部門ソリューション事業部 (略称: 富士通Japan)
Section Solutions Div., , Solutions Development Unit, Fujitsu Japan Limited (略称: Fujitsu Japan) |
第5著者 氏名(和/英/ヨミ) |
井口 寧 / Yasushi Inoguchi / イノグチ ヤスシ |
第5著者 所属(和/英) |
北陸先端科学技術大学院大学 (略称: 北陸先端大)
Japan Advanced Institute of Science and Technolog (略称: JAIST) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2023-12-05 17:40:00 |
発表時間 |
25分 |
申込先研究会 |
CPSY |
資料番号 |
CPSY2023-31 |
巻番号(vol) |
vol.123 |
号番号(no) |
no.293 |
ページ範囲 |
pp.25-30 |
ページ数 |
6 |
発行日 |
2023-11-28 (CPSY) |
|