講演抄録/キーワード |
講演名 |
2020-03-03 09:00
[ポスター講演]日本語end-to-end音声合成を用いた韻律シンボル教示とその音響的実現に関する音声教育的考察 ○吉澤風希(東大)・熊野 正(NHK)・峯松信明(東大)・栗原 清(NHK) EA2019-137 SIP2019-139 SP2019-86 |
抄録 |
(和) |
日本語教育における韻律シンボル教示の効果を検討するために、end-to-end音声合成システムの学習プロセスを人間の学習者の韻律習得プロセスとみなし、異なる韻律シンボル教示の学習効果を比較する手法を提案した。日本語のアクセントとイントネーションはともにピッチにより実現されており、単語内でのピッチの急峻な下降はアクセントによるものであるが、一方で語頭ピッチ上昇の要因がアクセントとイントネーションのどちらであるかについては、2つの理論が存在する。現状の日本語音声教育では、これらの理論に基づく複数の韻律教示方法が混在しており、教育効果によってこれらの教示方法を評価する必要がある。本稿では、読み仮名と韻律シンボルを入力とする日本語end-to-end音声合成システムを用い、複数の教示方法を再現する形で構成した韻律シンボルをテキストに付与した上で、対応する音声と共にシステムに学習させた。学習されたシステムによる合成音声の韻律自然性を主観評価させたところ、韻律の教示方法によって差が生じず、少なくとも機械学習においては、2つの理論は学習効果において等価であると考えられる。本稿では、この等価性について教育的な観点からの考察も加える。 |
(英) |
In order to examine the educational effect of presenting prosodic symbols to learners of Japanese, a method was proposed, where a training process of an end-to-end speech synthesizer was viewed as process of a human learner's learning Japanese prosody. By this method, different sets of prosodic symbols can be compared based on naturalness of synthetic voices. We consider that this method can give us some hints to discuss what kind of prosodic symbols will be more effective to be presented to learners. In this paper, two theories of Japanese prosody were focused on, which differ in how a given pitch pattern should be decomposed into accentuation and intonation. In textbooks, visualization of Japanese prosody is done on either of these models, resulting in somewhat different and confusing prosody visualization. In this paper, these theories were embodied using prosodic symbols used in training end-to-end speech synthesizers. Results of listening tests showed no significant difference between the two types of prosody generated based on the two theories. This implies that the theoretical differences may not affect acquired prosodic control at least in machine learning. This paper adds some educational discussion on the obtained results. |
キーワード |
(和) |
日本語音声教育 / アクセント / イントネーション / 韻律シンボル / end-to-end音声合成 / 教育効果 / / |
(英) |
prosody training in Japanese / accentuation / intonation / prosodic symbols / end-to-end speech synthesis / educational effect / / |
文献情報 |
信学技報, vol. 119, no. 441, SP2019-86, pp. 207-212, 2020年3月. |
資料番号 |
SP2019-86 |
発行日 |
2020-02-24 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2019-137 SIP2019-139 SP2019-86 |
|