オンライン適応自然勾配法による囲碁の盤面評価の学習

富澤,弘貴; 前田,新一; 石井,信

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2010-03-11 11:05 オンライン適応自然勾配法による囲碁の盤面評価の学習 ○富澤弘貴・前田新一・石井　信（京大） NC2009-164
抄録	（和）	囲碁は、黒石と白石の2種類の石のみを使うシンプルなルールをもつゲームであるが、$19\times19$の広い盤面を用いるため先読みなどの探索が難しく、エキスパートの棋力に迫るコンピュータ囲碁エージェントが出現していないのが現状である。コンピュータ囲碁エージェントの作成には盤面評価を行う必要があるが、本研究ではエキスパート同士が対戦した棋譜を用いた囲碁の盤面評価関数の教師あり学習を提案する。この教師あり学習では、階層型ニューラルネットワークを用い、入力を対戦棋譜中のある一つの盤面、出力をその対戦の勝敗を表す二値(0, 1)として学習を行うことで、入力として与えられた盤面における期待勝率(盤面評価) を出力することが期待される。囲碁の盤面のような高次元入力データをもつデータを過学習せずに学習させるのは困難であるが、囲碁の特性を利用したパラメータ削減を行うことでパラメータ空間の自由度を制限した。また、大量のデータを高速に学習させるためにフィッシャー情報行列をブロック対角行列で近似し、その逆行列を逐次的に計算可能なオンライン適応自然勾配法を用いた。
	（英）	We propose a supervised learning of Go board state evaluation function with many game records of experts'. By training a hierarchical neural network of which input is a board state of game records and output is binary (Black's win or White's win), the network is expected to output the expected winning probability (evaluation) of input board state. Because it is difficult to learn large dimensional data such as Go board without overtraining, we restrict the dimension of parameters by taking into account of Go specific properties. Furthermore, we use online adaptive natural gradient method of which fisher information matrix is approximated by a block diagonal matrix to learn the huge number of data faster.
キーワード	（和）	囲碁 / ニューラルネットワーク / 適応自然勾配法 / / / / /
	（英）	Go / neural network / adaptive natural gradient method / / / / /
文献情報		信学技報, vol. 109, no. 461, NC2009-164, pp. 449-454, 2010年3月.
資料番号		NC2009-164
発行日		2010-03-02 (NC)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		NC2009-164

研究会情報
研究会	NC MBE
開催期間	2010-03-09 - 2010-03-11
開催地（和）	玉川大学
開催地（英）	Tamagawa University
テーマ（和）	一般
テーマ（英）	General
講演論文情報の詳細
申込み研究会	NC
会議コード	2010-03-NC-MBE
本文の言語	日本語
タイトル（和）	オンライン適応自然勾配法による囲碁の盤面評価の学習
サブタイトル（和）
タイトル（英）	Learning of Go board state evaluation by online adaptive natural gradient method
サブタイトル（英）
キーワード(1)（和/英）	囲碁 / Go
キーワード(2)（和/英）	ニューラルネットワーク / neural network
キーワード(3)（和/英）	適応自然勾配法 / adaptive natural gradient method
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	富澤弘貴 / Hiroki Tomizawa / トミザワヒロキ
第1著者所属（和/英）	京都大学 (略称：京大) Kyoto university (略称： Kyoto Univ.)
第2著者氏名（和/英/ヨミ）	前田新一 / Shin-ichi Maeda / マエダシンイチ
第2著者所属（和/英）	京都大学 (略称：京大) Kyoto university (略称： Kyoto Univ.)
第3著者氏名（和/英/ヨミ）	石井信 / Shin Ishii / イシイシン
第3著者所属（和/英）	京都大学 (略称：京大) Kyoto university (略称： Kyoto Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2010-03-11 11:05:00
発表時間	25分
申込先研究会	NC
資料番号	NC2009-164
巻番号（vol）	vol.109
号番号（no）	no.461
ページ範囲	pp.449-454
ページ数	6
発行日	2010-03-02 (NC)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会