講演抄録/キーワード |
講演名 |
2016-08-08 16:45
EMAXVにおける複数バースト転送と複数ベクトル演算のオーバラップ手法 ○中島康彦(奈良先端大) CPSY2016-15 |
抄録 |
(和) |
近年,DSA(Domain-Specific Accelerator)に関する研究が盛んである[11].これまでに,LAPP[5] において,バイナリ互換と低次数ステンシル計算の高速化を両立するCGRA を開発し,EMAX2 [8] において,高次数ステンシル計算の高速化と低電力化を図るために,メモリ内蔵UNIT とリング接続による効率的なデータ再利用機構を
導入した.さらにEMAX4 [9] では,グラフ処理高速化のためにトランザクションユニットを導入した.しかし,最近の画像認識に使用する16x16 畳み込み演算や離散ステンシル計算であるライトフィールド画像処理などに対応するには,ローカルメモリのさらなるスループット向上と効率的な演算オーバラップが必要である.本稿では,低速演算器と高速主記憶の組み合わせを最大限活用するEMAXV の考え方と見積り性能を示す.また,レジスタトランスファレベルシミュレータによる評価の結果,320x240 画像に対する16x16 畳み込み演算,および,7Kx5K ライトフィールド
画像処理(距離計算)では,ARMv8 シングルスレッドに対して各々8.8 および43.8 倍,EMAX2 に対して後者は19.6倍の性能向上を期待できることを示す. |
(英) |
|
キーワード |
(和) |
CGRA / 畳み込み演算 / 離散ステンシル計算 / 離散ステンシル計算 / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 116, no. 177, CPSY2016-15, pp. 71-76, 2016年8月. |
資料番号 |
CPSY2016-15 |
発行日 |
2016-08-01 (CPSY) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CPSY2016-15 |