講演抄録/キーワード |
講演名 |
2015-07-16 13:30
非母語音声の認識のための実音声を用いた発音辞書獲得 ○辻岡 聡(奈良先端大)・リアン ルー(エディンバラ大)・サクリアニ サクティ・グラム ニュービッグ・戸田智基・中村 哲(奈良先端大) SP2015-36 |
抄録 |
(和) |
国際会議などでは英語が国際標準語として用いられ,英語非母語話者の間でも英語で意思疎通を図る場面が多い.このような非母語音声を認識して議事録を作成するなどの応用技術を考えた場合,非母語音声認識を高精度に行う必要がある.しかし,非母語話者の音声は母語話者に比べ,発音の揺らぎやブレが原因となり,非母語音声の認識精度は母語音声よりも低下する問題が生じる.非母語音声認識において,音響モデル,発音辞書,言語モデル,デコーディングの各処理系にて考慮する必要があるが,本研究では発音辞書に焦点を当てる.非母語話者の発音の揺れに対処するために,単語表記列から発音系列候補を予測するG2P(Grapheme-to-phoneme)ツールを用いて,複数の発音バリエーションを生成し,非母語音声話者の実音声から生起頻度の高い発音バリエーションを推定する手法を検討する.その発音バリエーションを発音辞書に適応した結果,発音の揺らぎやブレに対応することができ,認識精度の向上を確認できた. |
(英) |
Nowadays, the English language is often used as a tool to facilitate communication at international meetings. Consequently, to apply automatic speech recognition (ASR) techniques for meeting dictation, the ASR system must have the capabilty to recognize utterances not only by native speakers but also by non-native speakers. However, the accuracy of non-native English ASR is still not satisfactory, and still has much room for improvement. To achieve this improvement, it is necessary to consider the acoustic model, pronunciation lexicon, language model, and decoding.
In this study, we focus on the pronunciation lexicon. Specifically, we propose a method that first uses a G2P (Grapheme-to-phoneme) tool to predict multiple candidate pronunciations for each word, then estimates the occurence frequency of pronunciation variations from the acoustic data of non-native speakers. In experiments, we find that the proposed method could cope with fluctuation and ambiguity of pronunciation, and it was able to achieve an improvement in recognition accuracy. |
キーワード |
(和) |
非母語音声認識 / 発音辞書モデリング / 確率的発音モデル / 日本人英語 / / / / |
(英) |
Non-native speech recognition / Lexical modeling / Probablistic pronunciation model / Japanese English / / / / |
文献情報 |
信学技報, vol. 115, no. 146, SP2015-36, pp. 1-6, 2015年7月. |
資料番号 |
SP2015-36 |
発行日 |
2015-07-09 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2015-36 |