講演抄録/キーワード |
講演名 |
2022-06-08 09:20
深層学習による推論処理の高速化手法の検討 ○岩本征弥・中西知嘉子(阪工大) RECONF2022-13 |
抄録 |
(和) |
深層学習などのAI技術は一般に計算量が大きく,CPU上で動作するには要求性能が非常に高くなる.エッジ端末で推論処理を行う「エッジAI」を実現するために,SoC FPGAを用いて安価かつ低消費電力で実装する手法を提案する.今回はEfficientNetを例として,EfficientNetの計算構造を分析し,処理時間の大半を占めていた処理をアクセラレートする回路を作成する.作成したシステムの処理時間を計測することで回路の各セグメントの処理を分析し,高速化を実現できた箇所を検証した.その後,さらなる高速化を図るための手法を検討し,実装・再計測を行うことで,処理時間削減に必要な手段を調査し,効果的な削減手法を考察した. |
(英) |
AI technologies such as deep learning are generally computationally intensive and have very high performance requirements to run on CPUs. We propose an inexpensive and low-power implementation method using SoC FPGAs to realize "edge AI" that performs inference processing at edge terminals. Using EfficientNet as an example, we analyze the computational structure of EfficientNet and create a circuit that accelerates the processing that takes up most of the processing time. By measuring the processing time of the created system, we analyzed the processing of each segment of the circuit and verified where the acceleration was achieved. We then studied methods for further acceleration, and by implementing and re-measuring the circuits, we investigated the means necessary to reduce the processing time and considered effective reduction methods. |
キーワード |
(和) |
深層学習 / 推論処理 / SoC FPGA / EfficientNet / 共有メモリ / キャッシュ管理 / / |
(英) |
deep learning / inference processing / SoC FPGA / EfficientNet / shared memory / Cache Management / / |
文献情報 |
信学技報, vol. 122, no. 60, RECONF2022-13, pp. 52-56, 2022年6月. |
資料番号 |
RECONF2022-13 |
発行日 |
2022-05-31 (RECONF) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
RECONF2022-13 |