講演抄録/キーワード |
講演名 |
2009-03-11 16:35
平均場近似を用いたHelmholtz Machineの学習 ○青木佑紀(奈良先端大)・前田新一・石井 信(京大) NC2008-113 |
抄録 |
(和) |
高次元データから特徴抽出を行って低次元データや二値化するなどコンパクトな表現に置き換えることがしばしば行われる。コンパクトな特徴表現は、データの圧縮や視覚化や学習を行う際の過学習の回避や、学習の高速化に有用である。Hinton とSalakhutdinov [8] は、数百万のパラメータをもつ階層型restricted Boltzmann machine(RBM) の学習にcontrastive divergence (CD) に基づく初期学習を適用することで、主成分分析よりも優れた圧縮性能を実現する特徴抽出法を提案した。CD を用いた学習では、素早い学習を実現する一方、コスト関数が不明なため、パラメータ更新時に適当なステップサイズを使わざるを得ないという問題があり、改善の余地があると考えられる。
本報告では、Helmholtz Machine (HM) に対して平均場近似を用いた学習アルゴリズムを導出し、コスト関数とそのパラメータ勾配の両方を評価可能な学習則を提案する。また、この学習則が特定の条件の下でRBM のCD による学
習則に一致することを示す。 |
(英) |
It is often required to extract a compact feature of an original high-dimensional datum. Such a compactfeature is useful to visualize the original data, or to avoid the over-fitting in the learning which usually requires parameters in proportion to the dimensionality of the data. Recently, Hinton and Salakhutdinov [8] proposed a new dimensionality reduction method, which shows a superior performance to the PCA in their demonstration. They used a hierarchical Boltzmann Machine with millions of parameters. It is well known that the learning of such a nonlinear function approximator is difficult because of local minima and overfitting; neverthless, it seems that they had avoided such possible problems by adopting a Contrastive Divergence (CD) learning in the pretraining. Although the CD learning provides a parameter update rule which realizes efficient learning, several potential disadvantages
remain: there are no theoretically justified choice for the step-size in updating the parameters because the cost function of CD learning is unknown.
In this report, we derive a learning algorithm of Helmholtz Machine
using a mean field approximation, which allows analytical evaluations of both of the cost function and its derivatives with respect to the parameters. Also, it is shown that the learning of the Helmholtz Machine is comparative to the CD learning of the Boltzmann machine under certain conditions. |
キーワード |
(和) |
Restricted Boltzmann Machine / Helmholtz Machine / Contrastive Divergence / 特徴抽出 / 平均場近似 / / / |
(英) |
Restricted Boltzmann Machine, / Helmholtz Machine, / Contrastive Divergence / Feature Extraction / Mean Field Approximation / / / |
文献情報 |
信学技報, vol. 108, no. 480, NC2008-113, pp. 57-62, 2009年3月. |
資料番号 |
NC2008-113 |
発行日 |
2009-03-04 (NC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NC2008-113 |