講演抄録/キーワード |
講演名 |
2014-05-24 11:30
[一般発表]システム統合のための音響モデルの識別学習 ○太刀岡勇気(三菱電機)・渡部晋治・ルルー ジョナトン・ハーシー ジョン(MERL) SP2014-15 |
抄録 |
(和) |
識別学習においては,単一のシステムを用いた場合,評価関数は正解ラベルを参照して音声認識性能が向上するように定められる.これに対して,多数決によって出力仮説を洗練するシステム統合手法では,補助仮説を生成する複数のシステムを構築する必要がある.本報では,これら双方の要求を相互情報量に基づく識別学習の枠組み内で統合する.すなわち,正解ラベルとの相互情報量を最大化しつつ,元のシステムの仮説との相互情報量を最小化することを目的とした評価関数を提案し,それを最適化することで補助システムのモデルを構築する.また,補助システムの学習データに元のシステムの正解不正解を考慮して重みづけることに対応していることに着目し,ブースティングとの密接な関係について分析する.これに加えて,実用的には,提案法は従来の識別学習法のラティスに基づくモデル変数更新アルゴリズムを単純に拡張して補助システムを構築するため,補助システムの出力が元のシステムからどの程度離れるかを調整することができる.第2回CHiMEチャレンジによる高騒音下音声認識の実験により,既存のシステム統合手法と比べて提案法の有効性が示された. |
(英) |
In discriminative training methods, the objective function is designed to improve the performance of automatic speech recognition with reference to correct labels using a single system. On the other hand, system combination methods, which output refined hypotheses by a majority voting scheme, need to build multiple systems that generate complementary hypotheses. This paper aims to unify the both requirements within a discriminative training framework based on the mutual information criterion. That is, we construct complementary models by optimizing the proposed objective function, which yields to minimize the mutual information with base systems' hypotheses, while maximize that with correct labels, at the same time. We also analyze that this scheme corresponds to weight the training data of a complementary system by considering correct and error tendencies in the base systems, which has close relationship with boosting methods. In addition, the proposed method can practically construct complementary systems by simply extending a lattice-based parameter update algorithm in discriminative training, and can adjust the degree of how much the complementary system outputs are different from base system ones. The experiments on highly noisy speech recognition (`The 2nd CHiME challenge') show the effectiveness of the proposed method, compared with a conventional system combination approach. |
キーワード |
(和) |
識別学習 / マージン学習 / ブースティング / システム統合 / 相互情報量最大化 / / / |
(英) |
Discriminative training / Margin training / Boosting / System combination / MMI / / / |
文献情報 |
信学技報, vol. 114, no. 52, SP2014-15, pp. 147-152, 2014年5月. |
資料番号 |
SP2014-15 |
発行日 |
2014-05-17 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-15 |