WaveNetボコーダにおける複数話者学習時の音声品質の向上

吉田,悟; 上ノ原,進吾; 古家,賢一

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2021-12-22 13:30 ［ポスター講演］WaveNetボコーダにおける複数話者学習時の音声品質の向上 ○吉田　悟・上ノ原進吾・古家賢一（大分大） EA2021-57
抄録	（和）	近年, ニューラルネットワークを用いた音声合成や声質変換技術が注目を集めており, 自然性の高い音声を合成することが可能である. WaveNet ボコーダのようなニューラルボコーダの学習には, 目標話者の音声が大量に必要です. これまで, 複数話者(目標話者以外の話者) の音声を学習させた研究が行われてきている. しかし, 複数話者の音声で学習させたWaveNet ボコーダの合成音声は, 目標話者の音声で学習させたものに比べて, 合成音声の音声品質が劣化するという問題がある. 本研究では, 複数話者学習を前提としたWaveNet ボコーダの音声品質向上のために, 従来のWaveNet に新たに畳み込み層を追加する手法を提案する. また, 目標話者の少量の学習データでファインチューニングすることで音声品質が向上するかも確認する. 評価実験の結果から, 提案手法は従来手法と比べ, 音声品質が向上したことを確認する.
	（英）	In recent years, speech synthesis and voice quality conversion techniques using neural networks have attracted much attention and are capable of synthesizing speech with high naturalness. In order to train a neural vocoder such as WaveNet vocoder, a large amount of speech of the target speaker is required. So far, research has been conducted on training speech of multiple speakers (speakers other than the target speaker). However, there is a problem that the speech quality of the synthesized speech of the WaveNet vocoder trained with the speech of multiple speakers is degraded compared with that trained with the speech of the target speaker. In this study, we propose a method of adding a new convolutional layer to the conventionalWaveNet in order to improve the speech quality of theWaveNet vocoder based on multi-speaker learning. We also confirm whether the speech quality can be improved by fine tuning with a small amount of training data of the target speaker. From the results of evaluation experiments, we confirm that the proposed method improves the speech quality compared to the conventional method.
キーワード	（和）	ボコーダ / WaveNet / 音声合成 / 深層学習 / / / /
	（英）	Vocoder / WaveNet / Speech Synthesis / Deep Learning / / / /
文献情報		信学技報, vol. 121, no. 311, EA2021-57, pp. 1-6, 2021年12月.
資料番号		EA2021-57
発行日		2021-12-15 (EA)
ISSN		Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		EA2021-57

研究会情報
研究会	EA US
開催期間	2021-12-22 - 2021-12-23
開催地（和）	崇城大学メインキャンパス SoLA2階（熊本県熊本市西区池田4-22-1）
開催地（英）	Sojo University
テーマ（和）	＜音響・超音波サブソサイエティ合同研究会＞応用／電気音響，超音波一般
テーマ（英）	[Joint Meeting on Acoustics and Ultrasonics Subsociety] Engineering/Electro Acoustics, Ultrasonics, etc.
講演論文情報の詳細
申込み研究会	EA
会議コード	2021-12-EA-US
本文の言語	日本語
タイトル（和）	WaveNetボコーダにおける複数話者学習時の音声品質の向上
サブタイトル（和）
タイトル（英）	Improved voice quality due to multi-speaker learning with WaveNet vocoder
サブタイトル（英）
キーワード(1)（和/英）	ボコーダ / Vocoder
キーワード(2)（和/英）	WaveNet / WaveNet
キーワード(3)（和/英）	音声合成 / Speech Synthesis
キーワード(4)（和/英）	深層学習 / Deep Learning
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	吉田悟 / Satoshi Yoshida / ヨシダサトシ
第1著者所属（和/英）	大分大学 (略称：大分大) Oita University (略称： Oita Univ.)
第2著者氏名（和/英/ヨミ）	上ノ原進吾 / Shingo Uenohara / ウエノハラシンゴ
第2著者所属（和/英）	大分大学 (略称：大分大) Oita University (略称： Oita Univ.)
第3著者氏名（和/英/ヨミ）	古家賢一 / Ken'ichi Furuya / フルヤケンイチ
第3著者所属（和/英）	大分大学 (略称：大分大) Oita University (略称： Oita Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2021-12-22 13:30:00
発表時間	120分
申込先研究会	EA
資料番号	EA2021-57
巻番号（vol）	vol.121
号番号（no）	no.311
ページ範囲	pp.1-6
ページ数	6
発行日	2021-12-15 (EA)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会