講演抄録/キーワード |
講演名 |
2010-06-18 09:00
Quinphone HM-netを用いた単語グラフ統合に基づく講演音声認識 ○加藤正治・小坂哲夫(山形大)・伊藤彰則・牧野正三(東北大) SP2010-28 |
抄録 |
(和) |
書き言葉においては高い認識精度が達成されているが,話し言葉では
言い淀み,フィラー, 不明瞭な発声などなどさまざまな問題があり,
未だ十分な性能は達成されていない.特に調音結合など音響的な変動
が大きく問題となっている.この問題を解決するためにtriphoneや
quinphoneなど環境依存モデルが提案されている.しかし,話し言葉
においてはこの調音結合の程度も変動する.このため本研究では単語
グラフ統合を用い,多くの音響モデルで作成した単語グラフを統合する
ことにより認識性能の向上を図った. |
(英) |
While high recognition performance has been achieved for read
speech, rather poor performance has been reported for spontaneous
speech recognition because it has various problems, such as
hesitations, filled pauses, unclear pronunciation, and so on.
In particular, acoustic variation caused by coarticulation
has become a serious problem. In order to solve the problem,
context-dependent models such as triphone or quinphone are
used for recognition. However, the strength of coarticulatory
effect varies widely in spontaneous speech. In this study,
we attempt to improve the recognition performance by using
a technique of word graph combination in which various acoustic
models are combined. |
キーワード |
(和) |
単語グラフ統合 / quinphone / HM-Net / 話し言葉 / 音声認識 / / / |
(英) |
word graph combination / quinphone / HM-Net / spontaneous speech / speech recognition / / / |
文献情報 |
信学技報, vol. 110, no. 81, SP2010-28, pp. 37-42, 2010年6月. |
資料番号 |
SP2010-28 |
発行日 |
2010-06-10 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2010-28 |