講演抄録/キーワード |
講演名 |
2021-12-22 13:30
[ポスター講演]WaveNetボコーダにおける複数話者学習時の音声品質の向上 ○吉田 悟・上ノ原進吾・古家賢一(大分大) EA2021-57 |
抄録 |
(和) |
近年, ニューラルネットワークを用いた音声合成や声質変換技術が注目を集めており, 自然性の高い音声を合成することが可能である. WaveNet ボコーダのようなニューラルボコーダの学習には, 目標話者の音声が大量に必要です. これまで, 複数話者(目標話者以外の話者) の音声を学習させた研究が行われてきている. しかし, 複数話者の音声で学習させたWaveNet ボコーダの合成音声は, 目標話者の音声で学習させたものに比べて, 合成音声の音声品質が劣化するという問題がある. 本研究では, 複数話者学習を前提としたWaveNet ボコーダの音声品質向上のために, 従来のWaveNet に新たに畳み込み層を追加する手法を提案する. また, 目標話者の少量の学習データでファインチューニングすることで音声品質が向上するかも確認する. 評価実験の結果から, 提案手法は従来手法と比べ, 音声品質が向上したことを確認する. |
(英) |
In recent years, speech synthesis and voice quality conversion techniques using neural networks have attracted much attention and are capable of synthesizing speech with high naturalness. In order to train a neural vocoder such as WaveNet vocoder, a large amount of speech of the target speaker is required. So far, research has been conducted on training speech of multiple speakers (speakers other than the target speaker). However, there is a problem that the speech quality of the synthesized speech of the WaveNet vocoder trained with the speech of multiple speakers is degraded compared with that trained with the speech of the target speaker. In this study, we propose a method of adding a new convolutional layer to the conventionalWaveNet in order to improve the speech quality of theWaveNet vocoder based on multi-speaker learning. We also confirm whether the speech quality can be improved by fine tuning with a small amount of training data of the target speaker. From the results of evaluation experiments, we confirm that the proposed method improves the speech quality compared to the conventional method. |
キーワード |
(和) |
ボコーダ / WaveNet / 音声合成 / 深層学習 / / / / |
(英) |
Vocoder / WaveNet / Speech Synthesis / Deep Learning / / / / |
文献情報 |
信学技報, vol. 121, no. 311, EA2021-57, pp. 1-6, 2021年12月. |
資料番号 |
EA2021-57 |
発行日 |
2021-12-15 (EA) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2021-57 |
研究会情報 |
研究会 |
EA US |
開催期間 |
2021-12-22 - 2021-12-23 |
開催地(和) |
崇城大学 メインキャンパス SoLA2階 (熊本県熊本市西区池田4-22-1) |
開催地(英) |
Sojo University |
テーマ(和) |
<音響・超音波サブソサイエティ合同研究会>応用/電気音響,超音波一般 |
テーマ(英) |
[Joint Meeting on Acoustics and Ultrasonics Subsociety] Engineering/Electro Acoustics, Ultrasonics, etc. |
講演論文情報の詳細 |
申込み研究会 |
EA |
会議コード |
2021-12-EA-US |
本文の言語 |
日本語 |
タイトル(和) |
WaveNetボコーダにおける複数話者学習時の音声品質の向上 |
サブタイトル(和) |
|
タイトル(英) |
Improved voice quality due to multi-speaker learning with WaveNet vocoder |
サブタイトル(英) |
|
キーワード(1)(和/英) |
ボコーダ / Vocoder |
キーワード(2)(和/英) |
WaveNet / WaveNet |
キーワード(3)(和/英) |
音声合成 / Speech Synthesis |
キーワード(4)(和/英) |
深層学習 / Deep Learning |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
吉田 悟 / Satoshi Yoshida / ヨシダ サトシ |
第1著者 所属(和/英) |
大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.) |
第2著者 氏名(和/英/ヨミ) |
上ノ原 進吾 / Shingo Uenohara / ウエノハラ シンゴ |
第2著者 所属(和/英) |
大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.) |
第3著者 氏名(和/英/ヨミ) |
古家 賢一 / Ken'ichi Furuya / フルヤ ケンイチ |
第3著者 所属(和/英) |
大分大学 (略称: 大分大)
Oita University (略称: Oita Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
第21著者 氏名(和/英/ヨミ) |
/ / |
第21著者 所属(和/英) |
(略称: )
(略称: ) |
第22著者 氏名(和/英/ヨミ) |
/ / |
第22著者 所属(和/英) |
(略称: )
(略称: ) |
第23著者 氏名(和/英/ヨミ) |
/ / |
第23著者 所属(和/英) |
(略称: )
(略称: ) |
第24著者 氏名(和/英/ヨミ) |
/ / |
第24著者 所属(和/英) |
(略称: )
(略称: ) |
第25著者 氏名(和/英/ヨミ) |
/ / |
第25著者 所属(和/英) |
(略称: )
(略称: ) |
第26著者 氏名(和/英/ヨミ) |
/ / |
第26著者 所属(和/英) |
(略称: )
(略称: ) |
第27著者 氏名(和/英/ヨミ) |
/ / |
第27著者 所属(和/英) |
(略称: )
(略称: ) |
第28著者 氏名(和/英/ヨミ) |
/ / |
第28著者 所属(和/英) |
(略称: )
(略称: ) |
第29著者 氏名(和/英/ヨミ) |
/ / |
第29著者 所属(和/英) |
(略称: )
(略称: ) |
第30著者 氏名(和/英/ヨミ) |
/ / |
第30著者 所属(和/英) |
(略称: )
(略称: ) |
第31著者 氏名(和/英/ヨミ) |
/ / |
第31著者 所属(和/英) |
(略称: )
(略称: ) |
第32著者 氏名(和/英/ヨミ) |
/ / |
第32著者 所属(和/英) |
(略称: )
(略称: ) |
第33著者 氏名(和/英/ヨミ) |
/ / |
第33著者 所属(和/英) |
(略称: )
(略称: ) |
第34著者 氏名(和/英/ヨミ) |
/ / |
第34著者 所属(和/英) |
(略称: )
(略称: ) |
第35著者 氏名(和/英/ヨミ) |
/ / |
第35著者 所属(和/英) |
(略称: )
(略称: ) |
第36著者 氏名(和/英/ヨミ) |
/ / |
第36著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2021-12-22 13:30:00 |
発表時間 |
120分 |
申込先研究会 |
EA |
資料番号 |
EA2021-57 |
巻番号(vol) |
vol.121 |
号番号(no) |
no.311 |
ページ範囲 |
pp.1-6 |
ページ数 |
6 |
発行日 |
2021-12-15 (EA) |
|