講演抄録/キーワード |
講演名 |
2009-01-14 10:45
マルチメディア応用ヘテロジニアスマルチコアアーキテクチャの評価 ○奥村大輔・ハシタ ムトゥマラ ウィシディスーリヤ・松田岳久・張山昌論・亀山充隆(東北大) ICD2008-139 エレソ技報アーカイブへのリンク:ICD2008-139 |
抄録 |
(和) |
ヘテロジニアスプロセッサは異種のプロセッサの利用により全体の性能を向上させることが可能であり,画像処理や画像認識の分野で注目されている.しかしながら異なるコア間の利用におけるデータ転送がボトルネックとなり,十分な性能が発揮できない問題がある.本稿では4 個のCPU と2 個の動的再構成プロセッサからなるヘテロジニアスプロセッサRP1 に画像認識アルゴリズムであるオプティカルフローおよびHOG を実装し,その評価を行った.動的再構成プロセッサである"Flexibe Engine/Generic ALU arrays(FE-GA)"はマルチメディアアプリケーション向けのアクセラレータとして動作する.処理速度向上のために,異なるコア間におけるデータの受け渡し時のオーバヘッドを減少させるタスク割り当て,処理するプロセッサに適したアルゴリズムへの変形を行った.これによりCPU単体の処理と比較しヘテロジニアスプロセッサではオプティカルフローでは30.3 倍,HOG では2.1 倍の消費電力あたりの処理速度を向上することができた. |
(英) |
Heterogeneous processors are attracted by the image processing and recognition applications due to their capability of drawing strengths of different cores to improve the overall performance. However, data transfer between different cores caues serious performance degradetion. In this paper, we evaluate optical flow and Histogram of Oriented Gradients(HOG) on a heterogeneous multicore processor RP1 that has four CPUs and two reconfigurable processors. The reconfiguralbe processor called Flexible Engine/Generic ALU arrays (FE-GA) works as an accelerator for multimedia applications. To improve the total performances, we present task allocation to reduce the data transfers between different cores and modification of an algorithm suitable for the FE-GA. The performances per watt for optical flow and HOG are improved by 30.3 times and 2.1 times in comparison with a single CPU. |
キーワード |
(和) |
動的再構成 / リコンフィギャラブルアーキテクチャ / オプティカルフロー / HOG / / / / |
(英) |
Dynamic Reconfiguration / Reconfigurable architecture / Optical flow / HOG / / / / |
文献情報 |
信学技報, vol. 108, no. 375, ICD2008-139, pp. 57-62, 2009年1月. |
資料番号 |
ICD2008-139 |
発行日 |
2009-01-06 (ICD) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICD2008-139 エレソ技報アーカイブへのリンク:ICD2008-139 |