講演抄録/キーワード |
講演名 |
2021-10-28 16:20
FPGA実装に向けた強化学習モデルの丸め誤差と学習性能に関する考察 ○小口大輔・守谷 哲・山本英明・佐藤茂雄(東北大) NC2021-24 |
抄録 |
(和) |
近年,機械学習の一つである強化学習はその幅広い可用性から,エッジコンピューティング向けにハードウェア実装が期待されている.しかし,強化学習アルゴリズムは計算コストが高く,回路リソースや消費電力に制約がかかるエッジデバイスに搭載する際の課題となっている.我々は,強化学習アルゴリズムを効率的に実行する専用ハードウェアアーキテクチャとFPGAでの実装について検討しており,本研究では行動価値(Q値)を表す変数のbit幅と学習性能の関係について調査した.FrozenLake迷路問題において,8 bit浮動小数点演算では学習性能が低下したが,16 bit浮動小数点演算ではCPU上での実行と並ぶ学習性能でありながら,回路リソースと消費電力の削減が可能となることを明らかにした. |
(英) |
In recent years, the hardware implementation of reinforcement learning (RL) has attracted attention due to its wide range availability. We study a dedicated hardware architecture, which efficiently executes RL algorithm, and its realization in an FPGA. We investigated the learning performance when the bit-length was limited and found that the performance was maintained even when the bit-length was limited to 16, which results in saving circuit resources and power consumption. |
キーワード |
(和) |
強化学習 / FPGA / Q学習 / エッジコンピューティング / / / / |
(英) |
Reinforcement Learning / FPGA / Q-learning / Edge Computing / / / / |
文献情報 |
信学技報, vol. 121, no. 223, NC2021-24, pp. 34-39, 2021年10月. |
資料番号 |
NC2021-24 |
発行日 |
2021-10-21 (NC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2021-24 |
研究会情報 |
研究会 |
MBE NC |
開催期間 |
2021-10-28 - 2021-10-29 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
NC,ME,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
NC |
会議コード |
2021-10-MBE-NC |
本文の言語 |
日本語 |
タイトル(和) |
FPGA実装に向けた強化学習モデルの丸め誤差と学習性能に関する考察 |
サブタイトル(和) |
|
タイトル(英) |
Study on rounding error and Learning performance of reinforcement learning model for FPGA implementation |
サブタイトル(英) |
|
キーワード(1)(和/英) |
強化学習 / Reinforcement Learning |
キーワード(2)(和/英) |
FPGA / FPGA |
キーワード(3)(和/英) |
Q学習 / Q-learning |
キーワード(4)(和/英) |
エッジコンピューティング / Edge Computing |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
小口 大輔 / Daisuke Oguchi / オグチ ダイスケ |
第1著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ) |
第2著者 氏名(和/英/ヨミ) |
守谷 哲 / Satoshi Moriya / モリヤ サトシ |
第2著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ) |
第3著者 氏名(和/英/ヨミ) |
山本 英明 / Hideaki Yamamoto / ヤマモト ヒデアキ |
第3著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ) |
第4著者 氏名(和/英/ヨミ) |
佐藤 茂雄 / Shigeo Sato / サトウ シゲオ |
第4著者 所属(和/英) |
東北大学 (略称: 東北大)
Tohoku University (略称: Tohoku Univ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2021-10-28 16:20:00 |
発表時間 |
25分 |
申込先研究会 |
NC |
資料番号 |
NC2021-24 |
巻番号(vol) |
vol.121 |
号番号(no) |
no.223 |
ページ範囲 |
pp.34-39 |
ページ数 |
6 |
発行日 |
2021-10-21 (NC) |