講演抄録/キーワード |
講演名 |
2014-03-16 09:25
GPU-BOXにおける幅優先探索の高速化 ○三石拓司・野村鎮平・宮島敬明(慶大)・鈴木 順・林 佑樹・菅 真樹(NEC)・天野英晴(慶大) CPSY2013-108 DC2013-95 |
抄録 |
(和) |
グラフ処理は様々な分野で応用されており,近年盛んに研究されている.データの大規模化に伴い,これらグラフ処理の高速化が要求される中,複数台のGPUを用いた並列処理が注目されている.本研究では,Ethernetベースのシステム仮想化技術ExpEtherを用いたマルチGPUシステムの試作機であるGPU-BOXにおいてグラフ処理アルゴリズムの1つである幅優先探索(BFS)の高速化手法を提案,実装を行う.BFSをGPU-BOXで行う場合はGPU間で多くの頂点を交換する必要があるという点と,GPU-BOXではGPU間通信にデータ転送スループットが小さいEthernetを介する必要があるという点を踏まえ,GPU間通信量を削減するという観点から高速化の実現を試みる.本研究では,各GPUそれぞれが既に訪問した頂点に関しては通信しないことで高速化を行う.結果的にGPUを4台搭載したGPU-BOXにおいて,本研究の提案手法によりGPU間通信量を30~40%削減することができ,約9%の性能向上を達成することができた. |
(英) |
The graph analysis has been applied in various fields related to big-data processing and actively researched in recent years. For processing a larger scale of graph, parallel computing with multi-GPUs is paid attention as an economical solution. Here, an efficient parallel method is proposed to solve a typical graph analysis, Breadth First Search (BFS) for multi-GPUs systems. Our target system is GPU-BOX, a prototype of multi-GPUs system using ExpEther which is a virtualization technology based on PCI express and Ethernet. Although many vertex datas between GPUs must be exchanged to run BFS on multi GPUs system, GPI-BOX provides only small communication performance because of using Ethernet. Our parallel algorithm for BFS is designed so as to reduce the traffic between GPUs as possible. The proposed method reduced 30–40% traffic between GPUs and improved the traditional parallel method by 9%. |
キーワード |
(和) |
GPU / クラスタ / ExpEther / グラフアルゴリズム / スケーラビリティ / / / |
(英) |
GPU / Cluster / ExpEther / Graph Algorithm / Scalability / / / |
文献情報 |
信学技報, vol. 113, no. 497, CPSY2013-108, pp. 235-240, 2014年3月. |
資料番号 |
CPSY2013-108 |
発行日 |
2014-03-08 (CPSY, DC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2013-108 DC2013-95 |