講演抄録/キーワード |
講演名 |
2023-06-23 13:50
FaderNetを用いた未知話者に対する音声印象変換 ○釘本 咲・中鹿 亘(電通大) SP2023-2 |
抄録 |
(和) |
本稿では声質変換手法の1つであるFaderNetVCを用いて話者性はそのままに音声の印象のみを変えるという先行研究をもとに印象ラベルを持たない未知話者に対しても印象変換可能なモデルを提案する.FaderNetVCはあらかじめ変換したい音声に話者ラベルを必要とするため,印象変換においても変換したい音声にはあらかじめ印象ラベルを定義しておかなければならないが,外部識別器(Classifier)を用いてこれを実現する.また従来法では印象ラベルの識別に正規分布を仮定していたが,精度向上のためにベータ分布を仮定した識別器も提案し,仮定する分布の違いによる印象変換性能を比較検討する. |
(英) |
This paper proposes a model that can convert impressions of unknown speakers who do not have impression labels, based on a previous study that used FaderNetVC, a voice conversion method, to change only the impression of speech without changing the speaker's identity. Since FaderNetVC requires a speaker label for the speech to be converted in advance, an impression label must be defined for the speech to be converted in advance for impression conversion. This is achieved by adding `Classifier' to the model. In addition, we propose a discriminator that assumes a beta distribution to improve the accuracy of the conventional method, which assumes a normal distribution for modelling impression labels. |
キーワード |
(和) |
FaderNetworks / 声質変換 / 印象変換 / / / / / |
(英) |
Fader Networks / voice conversion / impression conversion / / / / / |
文献情報 |
信学技報, vol. 123, no. 88, SP2023-2, pp. 4-7, 2023年6月. |
資料番号 |
SP2023-2 |
発行日 |
2023-06-16 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2023-2 |