お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-07-30 11:10
強化学習におけるエントロピーを用いた空間分割方法の変更タイミングの決定
小森祐希野津 亮本多克宏市橋秀友阪府大NC2012-15
抄録 (和) 強化学習の代表的な手法であるQ学習では,連続状態空間や連続行動空間を扱う際,空間の離散化を行う必要がある.本研究では,より適した離散化を行うために,空間分割方法を学習の進度に応じて変更させた.また,自動的に適切な変更タイミングを定めるために,学習残余エントロピーを求めて指標とする手法を提案し,考察を行った. 
(英) We tested a single pendulum simulation and observed the influence of the several situation space segmentation patterns in reinforcement learning processes in order to propose new determination of the change timing of space segmentation. Its segmentation is performed by Segmentation and Integration method or Contraction Method. Additionally, the entropy, which was de ned on action values' distributions was used to get the timing of the changing space segmentation. Simulation results were shown to demonstrate the influence and adaptability of the proposed method.
キーワード (和) 強化学習 / 連続空間の離散化 / エントロピー / / / / /  
(英) Reinforcement learning / Space segmentation / Entropy / / / / /  
文献情報 信学技報, vol. 112, no. 168, NC2012-15, pp. 9-12, 2012年7月.
資料番号 NC2012-15 
発行日 2012-07-23 (NC) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NC2012-15

研究会情報
研究会 NC  
開催期間 2012-07-30 - 2012-07-31 
開催地(和) 立命館大学 情報理工学部 クリエーションコア1階教授会会議室 
開催地(英) Ritsumeikan Univ. College of Information Science and Engineering 
テーマ(和) 一般 
テーマ(英) General 
講演論文情報の詳細
申込み研究会 NC 
会議コード 2012-07-NC 
本文の言語 日本語 
タイトル(和) 強化学習におけるエントロピーを用いた空間分割方法の変更タイミングの決定 
サブタイトル(和)  
タイトル(英) Determination of the Change Timing of Space Segmentation Using the Entropy for Reinforcement Learning 
サブタイトル(英)  
キーワード(1)(和/英) 強化学習 / Reinforcement learning  
キーワード(2)(和/英) 連続空間の離散化 / Space segmentation  
キーワード(3)(和/英) エントロピー / Entropy  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 小森 祐希 / Yuki Komori / コモリ ユキ
第1著者 所属(和/英) 大阪府立大学 (略称: 阪府大)
Osaka Prefecture University (略称: Osaka Pref. Univ.)
第2著者 氏名(和/英/ヨミ) 野津 亮 / Akira Notsu / ノツ アキラ
第2著者 所属(和/英) 大阪府立大学 (略称: 阪府大)
Osaka Prefecture University (略称: Osaka Pref. Univ.)
第3著者 氏名(和/英/ヨミ) 本多 克宏 / Katsuhiro Honda / ホンダ カツヒロ
第3著者 所属(和/英) 大阪府立大学 (略称: 阪府大)
Osaka Prefecture University (略称: Osaka Pref. Univ.)
第4著者 氏名(和/英/ヨミ) 市橋 秀友 / Hidetomo Ichihashi /
第4著者 所属(和/英) 大阪府立大学 (略称: 阪府大)
Osaka Prefecture University (略称: Osaka Pref. Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-07-30 11:10:00 
発表時間 25分 
申込先研究会 NC 
資料番号 NC2012-15 
巻番号(vol) vol.112 
号番号(no) no.168 
ページ範囲 pp.9-12 
ページ数
発行日 2012-07-23 (NC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会