お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-12-22 13:30
[ポスター講演]WaveNetボコーダにおける複数話者学習時の音声品質の向上
吉田 悟上ノ原進吾古家賢一大分大EA2021-57
抄録 (和) 近年, ニューラルネットワークを用いた音声合成や声質変換技術が注目を集めており, 自然性の高い音声を合成することが可能である. WaveNet ボコーダのようなニューラルボコーダの学習には, 目標話者の音声が大量に必要です. これまで, 複数話者(目標話者以外の話者) の音声を学習させた研究が行われてきている. しかし, 複数話者の音声で学習させたWaveNet ボコーダの合成音声は, 目標話者の音声で学習させたものに比べて, 合成音声の音声品質が劣化するという問題がある. 本研究では, 複数話者学習を前提としたWaveNet ボコーダの音声品質向上のために, 従来のWaveNet に新たに畳み込み層を追加する手法を提案する. また, 目標話者の少量の学習データでファインチューニングすることで音声品質が向上するかも確認する. 評価実験の結果から, 提案手法は従来手法と比べ, 音声品質が向上したことを確認する. 
(英) In recent years, speech synthesis and voice quality conversion techniques using neural networks have attracted much attention and are capable of synthesizing speech with high naturalness. In order to train a neural vocoder such as WaveNet vocoder, a large amount of speech of the target speaker is required. So far, research has been conducted on training speech of multiple speakers (speakers other than the target speaker). However, there is a problem that the speech quality of the synthesized speech of the WaveNet vocoder trained with the speech of multiple speakers is degraded compared with that trained with the speech of the target speaker. In this study, we propose a method of adding a new convolutional layer to the conventionalWaveNet in order to improve the speech quality of theWaveNet vocoder based on multi-speaker learning. We also confirm whether the speech quality can be improved by fine tuning with a small amount of training data of the target speaker. From the results of evaluation experiments, we confirm that the proposed method improves the speech quality compared to the conventional method.
キーワード (和) ボコーダ / WaveNet / 音声合成 / 深層学習 / / / /  
(英) Vocoder / WaveNet / Speech Synthesis / Deep Learning / / / /  
文献情報 信学技報, vol. 121, no. 311, EA2021-57, pp. 1-6, 2021年12月.
資料番号 EA2021-57 
発行日 2021-12-15 (EA) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2021-57

研究会情報
研究会 EA US  
開催期間 2021-12-22 - 2021-12-23 
開催地(和) 崇城大学 メインキャンパス SoLA2階 (熊本県熊本市西区池田4-22-1) 
開催地(英) Sojo University 
テーマ(和) <音響・超音波サブソサイエティ合同研究会>応用/電気音響,超音波一般 
テーマ(英) [Joint Meeting on Acoustics and Ultrasonics Subsociety] Engineering/Electro Acoustics, Ultrasonics, etc. 
講演論文情報の詳細
申込み研究会 EA 
会議コード 2021-12-EA-US 
本文の言語 日本語 
タイトル(和) WaveNetボコーダにおける複数話者学習時の音声品質の向上 
サブタイトル(和)  
タイトル(英) Improved voice quality due to multi-speaker learning with WaveNet vocoder 
サブタイトル(英)  
キーワード(1)(和/英) ボコーダ / Vocoder  
キーワード(2)(和/英) WaveNet / WaveNet  
キーワード(3)(和/英) 音声合成 / Speech Synthesis  
キーワード(4)(和/英) 深層学習 / Deep Learning  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 吉田 悟 / Satoshi Yoshida / ヨシダ サトシ
第1著者 所属(和/英) 大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.)
第2著者 氏名(和/英/ヨミ) 上ノ原 進吾 / Shingo Uenohara / ウエノハラ シンゴ
第2著者 所属(和/英) 大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.)
第3著者 氏名(和/英/ヨミ) 古家 賢一 / Ken'ichi Furuya / フルヤ ケンイチ
第3著者 所属(和/英) 大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2021-12-22 13:30:00 
発表時間 120分 
申込先研究会 EA 
資料番号 EA2021-57 
巻番号(vol) vol.121 
号番号(no) no.311 
ページ範囲 pp.1-6 
ページ数
発行日 2021-12-15 (EA) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会