お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-11-08 11:30
同一文発話間における話者内スペクトル特徴量変動とその予測
犬飼辰夫戸田智基グラム ニュービッグサクリアニ サクティ中村 哲奈良先端大SP2012-74
抄録 (和) 統計的声質変換技術におけるスペクトルパラメータ変換処理おいて,その評価指標や変換モデルの学習指標として,しばしば変換パラメータと目標パラメータ間の距離尺度(例えばメルケプストラムひずみ)が用いられる.しかしながら,同一話者が同一文を発話した際においても,スペクトルパラメータは変動するため,スペクトルパラメータ間の距離は零とはならない.また,特にリアルタイム変換処理においては,複雑な変換処理を韻律パラメータに対して施すことは困難であるため,しばしば入力音声の韻律特徴を保持した変換音声が生成される.同一話者が同一文を異なる韻律特徴で発話した音声を生成することが目標となるが,この際に許容される発話間のスペクトルパラメータ間の距離についても考慮されていない.本報告では,スペクトルパラメータとしてメルケプストラムに着目し,同一話者が同一文を発話したときに生じるその変動量について調査する.また,発話間の韻律特徴の違いから,メルケプストラムの変動量を予測する手法を提案し,実験的評価結果から,その有効性を示す. 
(英) In spectral conversion of statistical voice conversion technologies, distance measures between the converted and target parameters, such as mel-cepstral distortion, are often used as evaluation/training metrics. However, even if the same speaker utters the same sentence, the spectral parameters of those utterances vary, and therefore, a distance between them still exists. Moreover, in real-time conversion procedure, converted speech keeping original prosodic features of input speech is often generated due to an essential difficulty of complex conversion of those features in real time. In such a case, an ideal sample of converted speech will be a speech sample uttered by a target speaker imitating prosody of the input speech but a spectral variation caused by such a prosodic change is not considered in the current evaluation/training metrics. In this report, we investigate an intra-speaker spectral variation between utterances of the same sentence focusing on mel-cepstrum as a spectral parameter. Moreover, we propose a method for predicting it from prosodic parameter differences between those utterances and conduct experimental evaluations to show its effectiveness.
キーワード (和) 声質変換 / 学習・評価指標 / スペクトル変動 / 同一文発話 / 韻律変動 / / /  
(英) voice conversion / training/evaluation metric / spectral variation / utterances of the same sentence / prosodic variation / / /  
文献情報 信学技報, vol. 112, no. 281, SP2012-74, pp. 13-18, 2012年11月.
資料番号 SP2012-74 
発行日 2012-11-01 (SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2012-74

研究会情報
研究会 SP  
開催期間 2012-11-08 - 2012-11-09 
開催地(和) 東北工業大学 一番町ロビー 
開催地(英) Ichibancho Lobby, Tohoku Institute of Technology 
テーマ(和) 合成,生成,韻律,音声一般 
テーマ(英) Speech Synthesis, Generation, Prosody, etc. 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2012-11-SP 
本文の言語 日本語 
タイトル(和) 同一文発話間における話者内スペクトル特徴量変動とその予測 
サブタイトル(和)  
タイトル(英) Intra-speaker spectral parameter variation between utterances of the same sentence and its prediction 
サブタイトル(英)  
キーワード(1)(和/英) 声質変換 / voice conversion  
キーワード(2)(和/英) 学習・評価指標 / training/evaluation metric  
キーワード(3)(和/英) スペクトル変動 / spectral variation  
キーワード(4)(和/英) 同一文発話 / utterances of the same sentence  
キーワード(5)(和/英) 韻律変動 / prosodic variation  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 犬飼 辰夫 / Tatsuo Inukai / イヌカイ タツオ
第1著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第2著者 氏名(和/英/ヨミ) 戸田 智基 / Tomoki Toda / トダ トモキ
第2著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第3著者 氏名(和/英/ヨミ) グラム ニュービッグ / Graham Neubig / グラム ニュービッグ
第3著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第4著者 氏名(和/英/ヨミ) サクリアニ サクティ / Sakriani Sakti / サクリアニ サクティ
第4著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第5著者 氏名(和/英/ヨミ) 中村 哲 / Satoshi Nakamura / ナカムラ サトシ
第5著者 所属(和/英) 奈良先端科学技術大学院大学 (略称: 奈良先端大)
Nara Institute of Science and Technology (略称: NAIST)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-11-08 11:30:00 
発表時間 30分 
申込先研究会 SP 
資料番号 SP2012-74 
巻番号(vol) vol.112 
号番号(no) no.281 
ページ範囲 pp.13-18 
ページ数
発行日 2012-11-01 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会