講演抄録/キーワード |
講演名 |
2017-06-24 13:00
再帰的な選択的注意モデルにおける注意領域サイズの強化学習 ○村田悠太朗・寺前順之介・若宮直紀(阪大) NC2017-18 |
抄録 |
(和) |
画像の一部を選択的に抽出して画像認識の精度を向上させる選択的注意の研究が近年盛んに行われてい
る.再帰的ニューラルネットワークを用いて選択的注意を実現した先行研究では,抽出する画像領域(注意領域)を
強化学習によって学習するが,注意領域サイズが固定されているため,認識できる物体の画像内での大きさが限定
されてしまうという問題があった.この問題を解決するため,本研究では,注意領域サイズを可変にする選択的注
意モデルを提案する.注意領域の位置のみを選択する先行研究では,注意領域位置のランダムサンプリングを通じ
て適切な注意領域位置を学習するが,注意領域の位置とサイズでは,サンプリングされる解空間の特性が異なるた
め,単純なサンプリングでは学習に失敗する.そこで本研究では注意領域サイズが持つ特性を考慮してサンプリン
グと強化学習手法の改良を行った.提案手法の妥当性を示すために,画像中に提示される文字サイズと選択された
注意領域サイズの関係を計測し,さらにサイズの異なる複数の手書き数字のクラス分類を行った. |
(英) |
Humans percept visual scenes with focusing only on significant parts of visual scenes sequentially rather
process whole of the visual stimuli entirely at once. Sequential visual attention attracts much attention recently in the
field of computer vision since it may largely reduce computational cost of image processing. A previous study proposed
the hard attention model, in which neural networks are trained to select suitable attended areas of visual fields for
visual recognition by using reinforcement learning. The model, however, cannot properly select attended area if sizes
of significant areas in visual scenes are different from that of training data since it cannot modulate size of attended
areas. To solve the problem, here, we propose a network model that can learn both position and size of attended area
of visual field. Since phase space features are significantly different between position and size of a selected visual scene,
they contribute to reinforcement signals in different manner, which causes undesirable bias and failure of learning. To
reduce the bias, we propose a new learning algorithm that almost keep balance of their contribution. We show that
our model can learn to suitably modulate the size of attended area and visual recognition with sequential attention. |
キーワード |
(和) |
強化学習 / 選択的注意 / 画像認識 / 再帰ニューラルネットワーク / / / / |
(英) |
reinforcement learning / visual attention / image recognition / recurrent neural network / / / / |
文献情報 |
信学技報, vol. 117, no. 109, NC2017-18, pp. 121-125, 2017年6月. |
資料番号 |
NC2017-18 |
発行日 |
2017-06-16 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2017-18 |
研究会情報 |
研究会 |
NC IPSJ-BIO IBISML IPSJ-MPS |
開催期間 |
2017-06-23 - 2017-06-25 |
開催地(和) |
沖縄科学技術大学院大学 |
開催地(英) |
Okinawa Institute of Science and Technology |
テーマ(和) |
機械学習によるバイオデータマインニング、一般 |
テーマ(英) |
Machine Learning Approach to Biodata Mining, and General |
講演論文情報の詳細 |
申込み研究会 |
NC |
会議コード |
2017-06-NC-BIO-IBISML-MPS |
本文の言語 |
日本語 |
タイトル(和) |
再帰的な選択的注意モデルにおける注意領域サイズの強化学習 |
サブタイトル(和) |
|
タイトル(英) |
Reinforcement learning for visual attention with scalable size of attentional field |
サブタイトル(英) |
|
キーワード(1)(和/英) |
強化学習 / reinforcement learning |
キーワード(2)(和/英) |
選択的注意 / visual attention |
キーワード(3)(和/英) |
画像認識 / image recognition |
キーワード(4)(和/英) |
再帰ニューラルネットワーク / recurrent neural network |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
村田 悠太朗 / Yutaro Murata / ムラタ ユウタロウ |
第1著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第2著者 氏名(和/英/ヨミ) |
寺前 順之介 / Jun-nosuke Teramae / テラマエ ジュンノスケ |
第2著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第3著者 氏名(和/英/ヨミ) |
若宮 直紀 / Naoki Wakamiya / ワカミヤ ナオキ |
第3著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2017-06-24 13:00:00 |
発表時間 |
25分 |
申込先研究会 |
NC |
資料番号 |
NC2017-18 |
巻番号(vol) |
vol.117 |
号番号(no) |
no.109 |
ページ範囲 |
pp.121-125 |
ページ数 |
5 |
発行日 |
2017-06-16 (NC) |