お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-07-16 13:30
非母語音声の認識のための実音声を用いた発音辞書獲得
辻岡 聡奈良先端大)・リアン ルーエディンバラ大)・サクリアニ サクティグラム ニュービッグ戸田智基中村 哲奈良先端大SP2015-36
抄録 (和) 国際会議などでは英語が国際標準語として用いられ,英語非母語話者の間でも英語で意思疎通を図る場面が多い.このような非母語音声を認識して議事録を作成するなどの応用技術を考えた場合,非母語音声認識を高精度に行う必要がある.しかし,非母語話者の音声は母語話者に比べ,発音の揺らぎやブレが原因となり,非母語音声の認識精度は母語音声よりも低下する問題が生じる.非母語音声認識において,音響モデル,発音辞書,言語モデル,デコーディングの各処理系にて考慮する必要があるが,本研究では発音辞書に焦点を当てる.非母語話者の発音の揺れに対処するために,単語表記列から発音系列候補を予測するG2P(Grapheme-to-phoneme)ツールを用いて,複数の発音バリエーションを生成し,非母語音声話者の実音声から生起頻度の高い発音バリエーションを推定する手法を検討する.その発音バリエーションを発音辞書に適応した結果,発音の揺らぎやブレに対応することができ,認識精度の向上を確認できた. 
(英) Nowadays, the English language is often used as a tool to facilitate communication at international meetings. Consequently, to apply automatic speech recognition (ASR) techniques for meeting dictation, the ASR system must have the capabilty to recognize utterances not only by native speakers but also by non-native speakers. However, the accuracy of non-native English ASR is still not satisfactory, and still has much room for improvement. To achieve this improvement, it is necessary to consider the acoustic model, pronunciation lexicon, language model, and decoding.
In this study, we focus on the pronunciation lexicon. Specifically, we propose a method that first uses a G2P (Grapheme-to-phoneme) tool to predict multiple candidate pronunciations for each word, then estimates the occurence frequency of pronunciation variations from the acoustic data of non-native speakers. In experiments, we find that the proposed method could cope with fluctuation and ambiguity of pronunciation, and it was able to achieve an improvement in recognition accuracy.
キーワード (和) 非母語音声認識 / 発音辞書モデリング / 確率的発音モデル / 日本人英語 / / / /  
(英) Non-native speech recognition / Lexical modeling / Probablistic pronunciation model / Japanese English / / / /  
文献情報 信学技報, vol. 115, no. 146, SP2015-36, pp. 1-6, 2015年7月.
資料番号 SP2015-36 
発行日 2015-07-09 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2015-36

研究会情報
研究会 SP IPSJ-SLP  
開催期間 2015-07-16 - 2015-07-17 
開催地(和) かたくら諏訪湖ホテル 
開催地(英) Katakura Suwako Hotel 
テーマ(和) 認識,理解,対話,一般 
テーマ(英) Speech recognition and understanding, dialog system, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2015-07-SP-SLP 
本文の言語 日本語 
タイトル(和) 非母語音声の認識のための実音声を用いた発音辞書獲得 
サブタイトル(和)  
タイトル(英) Acoustic data-driven pronunciation lexicon for non-native speech recognition 
サブタイトル(英)  
キーワード(1)(和/英) 非母語音声認識 / Non-native speech recognition  
キーワード(2)(和/英) 発音辞書モデリング / Lexical modeling  
キーワード(3)(和/英) 確率的発音モデル / Probablistic pronunciation model  
キーワード(4)(和/英) 日本人英語 / Japanese English  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 辻岡 聡 / Satoshi Tsujioka / ツジオカ サトシ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) リアン ルー / Liang Lu / リアン ルー
第2著者 所属(和/英) エディンバラ大学 (略称: エディンバラ大)
University of Edinburgh (略称: University of Edinburgh)
第3著者 氏名(和/英/ヨミ) サクリアニ サクティ / Sakriani Sakti / サクリアニ サクティ
第3著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第4著者 氏名(和/英/ヨミ) グラム ニュービッグ / Graham Neubig / グラム ニュービッグ
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第5著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第5著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第6著者 氏名(和/英/ヨミ) 中村 哲 / Satoshi Nakamura / ナカムラ サトシ
第6著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2015-07-16 13:30:00 
発表時間 30分 
申込先研究会 SP 
資料番号 SP2015-36 
巻番号(vol) vol.115 
号番号(no) no.146 
ページ範囲 pp.1-6 
ページ数
発行日 2015-07-09 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会