講演抄録/キーワード |
講演名 |
2015-01-22 14:40
日本人英語発声を対象とした単語明瞭度の自動予測 ~ 特徴量とモデルに関する比較研究 ~ ○ポンキッティパン ティーラポン・峯松信明(東大)・牧野武彦(中大)・齋藤大輔・広瀬啓吉(東大) SP2014-132 |
抄録 |
(和) |
日本語訛りを有する英語音声に対して、どの単語が、米語母語話者にとって聞き取り難くなってしまうのかを自動予測することを検討している。本研究では、ERJ intelligibility データベースを用いている。これは、日本人によって発声された800文発声が、173名の米語母語話者によって聴取、書き取られ、各単語毎に聴取率が定義されている。先行研究において、入力テキストあるいは入力音声に対する聴取率予測器を構築した。そこでは、入力テキストから抽出される言語的特徴や、入力音声から抽出される音声学的発音距離や単語の混同性を計算し、CART を使って聴取率の予測を行なった。本研究では、新たな特徴として韻律的特徴を検討し、また、予測モデルとしては新たに三種類のモデル(Adaboost、Random Forest、Extremely Randomized Trees)を検討した。評価実験として「非常に聞き取り難くなる単語」の同定、「やや聞き取り難くなる単語」の同定を行なった。その結果、両タスクにおいてF1スコアが72.74%、84.78%となり、良好な結果を得ることができた。 |
(英) |
This study investigates automatic prediction of the words in given sentences that will be unintelligible to American listeners when they are pronounced with Japanese accents. The ERJ intelligibility database contains results of a large listening test, where 800 English sentences read with Japanese accents were presented to 173 American listeners and correct perception rate was obtained for each spoken word. By using this database, in our previous study, an intelligibility predictor was built for each word of input texts or utterances. For prediction, lexical and linguistic features were extracted from texts and pronunciation distance and word confusability were calculated from utterances. CART was used as prediction model. In this paper, new features that are related to speech prosody and three new prediction models of ensemble methods (Adaboost, Random Forest and Extremely Randomized Trees) are tested and compared to the old features and model. Finally, our new system can predict very unintelligible and rather unintelligible words with F1-scores of 72.74% and 84.78%, respectively. |
キーワード |
(和) |
明瞭度 / 日本人英語データベース / 韻律的特徴 / 機械学習 / 国際音声記号 / 第二言語 / 外国訛り / |
(英) |
spoken word intelligibility / ERJ database / prosodic features / machine learning / IPA / L2 learning / foreign accent / |
文献情報 |
信学技報, vol. 114, no. 411, SP2014-132, pp. 31-36, 2015年1月. |
資料番号 |
SP2014-132 |
発行日 |
2015-01-15 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-132 |