講演抄録/キーワード |
講演名 |
2014-02-28 11:00
世界諸英語分類のための構造的表象を用いた発音距離予測 ○笠原 駿・峯松信明(東大)・沈 涵平(成功大)・牧野武彦(中大)・齋藤大輔・広瀬啓吉(東大) SP2013-109 |
抄録 |
(和) |
国際語として利用されている英語の様態を指し示す言葉として世界諸英語がある。発音の観点から世界諸英語を説明すれば、「英語には標準的な発音は存在せず、各国、地域、更には個人が各々異なった発音を有する」現状をそのまま受入れることを意味する。このような価値観に立てば、話者本人の英語発音が世界諸英語の中でどのように位置づけられるかを知ることは有益である。本研究では、個人を単位とした世界諸英語発音分類を念頭に置き、任意の二話者間の英語発音距離(英語訛りの違いの度合い)を、入力音声のみから自動で予測することを試みた。性別や年齢などによって音声特徴は変形するが、この変形に対し不変量となる構造的表象とサポートベクター回帰を用いて、発音距離を予測した。本稿では、回帰モデル学習を、話者対openな学習・評価データセット、話者openな学習・評価データセットを用いる二通りの条件下で行ない、各々の予測性能を検証した。実験の結果、話者対open条件では完全音素認識器を超える予測精度を持つことが示されたが、話者open条件
では精度が低いことが示された。未知話者間の発音距離を予測するためには、さらなる改善が必要である。 |
(英) |
The term of World Englishes is often used to indicate the current state of English as international language.It claims that English does not have the standard pronunciation and that every country, region, and even individual uses different pronunciations. From the viewpoint of World Englishes, it will be much more important to let each speaker know how his/her pronunciation is located in the diversity of World Englishes pronunciations, not how his/her pronunciation is incorrect compared to native pronunciations. This study tries to predict inter-speaker pronunciation distances only by speech analysis to examine the possibility of individual-basis pronunciation clustering of World Englishes. Speech features are often altered by non-linguistic factors such as age and gender differences. Considering this, the pronunciation structure, known as speaker-invariant feature, and support vector regression were applied for prediction. In the experiments, two conditions of a speaker-pair-open mode and a speaker-open mode were examined for training and testing the SVR. As a result, although a striking performance was obtained in the speaker-pair-open mode, only insufficient performances were found in the speaker-open mode. To predict pronunciation distances between unknown speakers, a further investigation is required. |
キーワード |
(和) |
世界諸英語 / 発音分類 / サポートベクター回帰 / 話者対open / 話者open / / / |
(英) |
World Englishes / pronunciation clustering / structural representation / support vector regression / speaker-pair-open / speaker-open / / |
文献情報 |
信学技報, vol. 113, no. 452, SP2013-109, pp. 13-18, 2014年2月. |
資料番号 |
SP2013-109 |
発行日 |
2014-02-21 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2013-109 |