講演抄録/キーワード |
講演名 |
2010-07-22 14:20
構造的特徴量に対する多段階の重回帰分析による発音評価 ○鈴木雅之・中村綾乃(東大)・喬 宇(Shenzhen Institutes)・峯松信明・広瀬啓吉(東大) SP2010-37 |
抄録 |
(和) |
国際化・情報化が急速に進む現在,コンピュータを用いた語学学習支援が盛んに研究され,教育現場に導入されている.語学学習のうち発音学習の支援には,子供から大人まで様々な声質を持つユーザにも頑健に動作する,精度の高い発音分析法が必要になる.しかし,現在広く用いられているHidden Markov Model (HMM)を利用する発音分析法では,分析結果がユーザの声質とHMMの学習データの声質のミスマッチに影響されて,分析精度の低下をもたらす.近年この問題を解決するために,声質の違いに近似的に不変な音声の構造的表象を利用した発音分析法が提案され,ミスマッチに非常に高い頑健性を持つ発音分析が実現された.しかし,特にミスマッチが小さい場合,HMMを用いる手法に劣っている問題があった.本稿では,音声の構造的表象を用いた発音分析の精度を改善するために,多段階の重回帰分析を提案する.これにより,声質のミスマッチに高い頑健性を保ったまま,ミスマッチの小さい条件でHMMを利用する場合と同等以上の精度が得られた.さらに,提案手法とHMMを用いる手法を適切に組み合わせることで,さらに良好な結果が得られた. |
(英) |
In the rapid internationalization and informatization, many research efforts have been made to build computer-aided language learning (CALL) systems. Good pronunciation assessment systems should be built using the technologies which can deal with acoustic variabilities found in learners' utterances caused by non-linguistic factors such as age and gender. However, the widely-used acoustic modeling technique of HMM often shows unstable performances with speakers of different ages and genders. Recently, a new method of representing learners' pronunciations with their non-linguistic features effectively removed, called pronunciation structure. In this method, only the contrastive features of speech are extracted. However, the excessively high dimensionality of the structure comes to degrade its performance and, to solve this problem, multilayer regression analysis with structural features is proposed in this paper. The results show much higher correlation between human and machine performances of assessing learners' pronunciations compared to the previously proposed structure-based method. Further, the proposed method shows much higher robustness compared to the widely-used HMM-based method. In this paper, we also propose a good combination of the structure and the HMM. |
キーワード |
(和) |
音声の構造的表象 / CALL / 重回帰分析 / GOP / / / / |
(英) |
speech structure / CALL / regression / GOP / / / / |
文献情報 |
信学技報, vol. 110, no. 143, SP2010-37, pp. 13-18, 2010年7月. |
資料番号 |
SP2010-37 |
発行日 |
2010-07-15 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2010-37 |
|