講演抄録/キーワード |
講演名 |
2010-06-18 14:15
多本腕バンディット問題に対する綱引きモデルについて ~ 非局所的に相関した並列サーチのための生物からヒントを得た計算手法 ~ ○金 成主・青野真士・原 正彦(理研) NLP2010-4 NC2010-4 |
抄録 |
(和) |
単細胞アメーバ・真性粘菌Physarum の光刺激回避行動に着想を得た「綱引きモデル」という並列探索アルゴリズムを提案する。このモデルでは、アメーバの複数の分枝が、環境情報を収集する探索エージェントとして機
能する。アメーバは、その総リソース量(総体積)を保存しつつ、複数の分枝を伸縮させることで光刺激を受容し、どの分枝を伸長させるかを決定する。このとき、保存則を介して生じる分枝間の「非局所的な相関」が、「多本腕バンディット問題」における“exploration–exploitation dilemma” と呼ばれるトレードオフ状況の効率的解決に寄与することを示す。また、他の分枝から伝わる光刺激情報がパフォーマンスに及ぼす影響についても報告する。 |
(英) |
The ``tug-of-war (TOW) model'' proposed in this study is a unique method for parallel searches inspired by the photoavoidance behavior of the single-celled amoeba, the true slime mold \textit{Physarum}.
In the TOW model, many branches of the amoeba act as search agents to collect information on light stimulations while conserving the total sum of their resources.
We show that the ``nonlocal correlation'' via resource conservation can be advantageous to manage the ``exploration--exploitation dilemma'' for solving the multi-armed bandit problem.
We also show the effect of the information on light stimulations from other branches on the TOW model's performance. |
キーワード |
(和) |
強化学習 / 多本腕バンディット問題 / 生物からヒントを得た計算 / 並列探索 / / / / |
(英) |
reinforcement learning / multi-armed bandit problem / bio-inspired computing / parallel search / / / / |
文献情報 |
信学技報, vol. 110, no. 82, NLP2010-4, pp. 19-24, 2010年6月. |
資料番号 |
NLP2010-4 |
発行日 |
2010-06-11 (NLP, NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLP2010-4 NC2010-4 |
研究会情報 |
研究会 |
NC NLP IPSJ-BIO |
開催期間 |
2010-06-18 - 2010-06-19 |
開催地(和) |
琉球大学50周年記念館 |
開催地(英) |
Ryukyu-daigaku-gozyu-syunen-kinenn-kaikan |
テーマ(和) |
機械学習によるバイオデータマインニング, 生命現象の非線形性, 一般 |
テーマ(英) |
Machine Learning for bio-datamining |
講演論文情報の詳細 |
申込み研究会 |
NLP |
会議コード |
2010-06-NC-NLP-BIO |
本文の言語 |
日本語 |
タイトル(和) |
多本腕バンディット問題に対する綱引きモデルについて |
サブタイトル(和) |
非局所的に相関した並列サーチのための生物からヒントを得た計算手法 |
タイトル(英) |
On the Tug-of-war Model for Multi-armed Bandit Problem: |
サブタイトル(英) |
Bio-inspired Computing Method for Nonlocally-correlated Parallel Searches |
キーワード(1)(和/英) |
強化学習 / reinforcement learning |
キーワード(2)(和/英) |
多本腕バンディット問題 / multi-armed bandit problem |
キーワード(3)(和/英) |
生物からヒントを得た計算 / bio-inspired computing |
キーワード(4)(和/英) |
並列探索 / parallel search |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
金 成主 / Song-Ju Kim / キム ソンジュ |
第1著者 所属(和/英) |
理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN) |
第2著者 氏名(和/英/ヨミ) |
青野 真士 / Masashi Aono / アオノ マサシ |
第2著者 所属(和/英) |
理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN) |
第3著者 氏名(和/英/ヨミ) |
原 正彦 / Masahiko Hara / ハラ マサヒコ |
第3著者 所属(和/英) |
理化学研究所 (略称: 理研)
RIKEN-HYU (略称: RIKEN) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-06-18 14:15:00 |
発表時間 |
25分 |
申込先研究会 |
NLP |
資料番号 |
NLP2010-4, NC2010-4 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.82(NLP), no.83(NC) |
ページ範囲 |
pp.19-24 |
ページ数 |
6 |
発行日 |
2010-06-11 (NLP, NC) |