講演抄録/キーワード |
講演名 |
2009-12-22 11:00
音声対話システムのためのN-gramに基づくキーワードからの文生成 ○吉見孔孝・南角吉彦・李 晃伸・徳田恵一(名工大) NLC2009-19 SP2009-83 |
抄録 |
(和) |
質問と応答の対応を文対文で統計的にモデル化する音声対話システムにおいては,
学習のために大量の質問文と応答文のペアが必要である.しかし,質問文データ
を用意するためにユーザの実際の発話を収集・書き起こしするのはコストが高く,
人手で可能な質問文のバリエーションを考えて収集するのも経験と労力を要する.
本研究では,この統計的応答選択システムのための質問文をキーワードから自動
生成する手法を提案する.文に含まれるべきキーワードが複数与えられたとき,
それらのキーワード間の区間および両端に出現しうる尤度上位の単語列をN-gram
確率に基づいて探索し,区間ごとに得られた単語列を結合・再評価を行い,最終
的にデータベースに与える文を選び出す.音声情報案内タスクの音声対話システ
ムにおいて実験した結果,入力に音声認識結果を用いるときに,応答をキーワー
ドと直接対応付ける場合に59.6\%の応答正解率であったのが,そのキーワードか
ら生成した文と対応付ける本手法を用いることで65.1\% に改善された.
さらに,タスク非依存の一般的なN-gramを使用した場合も,同様に性能の改善が
見られた.生成する文数や,単語列探索時のビーム幅などの様々なパラメータに
よる性能の変化についても報告する. |
(英) |
A probabilistic answer selection on spoken dialog system requires a lot of question-and-answer pair as a training data. However, it costs much to collect a sufficient amount of transcription of user's utterance, or to make the question database manually. In this paper, a sentence generation method based on word N-gram to build a question database of a spoken dialog system from given keywords. First, the best word sequences between the keywords are searched based on N-gram. Then, they are concatenated each other and rescored to get the final sentences to be used for the training data. The proposed method was experimented on a public speech-oriented information guidance system. It has been shown that the conventional method with only keywords could get the correct response rate of 59.6\%, whereas the proposed method which uses the generated sentences as training data got 65.1\%, when using recognized text. Experiments on task-independent N-gram (Web / Newspaper model) also showed that the proposed method can achieve higher accuracy than the conventional method. Comparisons of various parameters were also investigated. |
キーワード |
(和) |
音声対話システム / N-gram / 文生成 / 探索 / / / / |
(英) |
Spoken dialog system / N-gram / Sentence generation / Search / / / / |
文献情報 |
信学技報, vol. 109, no. 356, SP2009-83, pp. 71-76, 2009年12月. |
資料番号 |
SP2009-83 |
発行日 |
2009-12-14 (NLC, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2009-19 SP2009-83 |
|