強調音声合成のための局所韻律コンテキスト自動付与の検討

前野,悠; 能勢,隆; 小林,隆夫; 井島,勇祐; 中嶋,秀治; 水野,秀之; 吉岡,理

ご案内入会して研究会活動をもっとお得に！研究会参加費・年間登録費が会員価格になります。
お知らせ【重要】研究会参加費の支払いおよび原稿アップロード手続きの変更に関するご案内

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2012-06-14 11:00 強調音声合成のための局所韻律コンテキスト自動付与の検討 ○前野　悠・能勢　隆・小林隆夫（東工大）・井島勇祐・中嶋秀治・水野秀之・吉岡　理（NTT） SP2012-33
抄録	（和）	HMM 音声合成において,多様なスタイルを伴う音声に現れる強調表現を合成音声に反映させるため,学習データに対する強調コンテキストの自動ラベリング手法を提案する. 我々はこれまでに商品宣伝を想定して収録された音声を対象とし,原音声と合成音声のアクセント句毎の基本周波数 (F0) の差分に着目した強調コンテキストのラベリング手法を提案した.しかし,この手法では強調/非強調を判定するための閾値をあらかじめ主観評価などにより決定する必要があった.これに対し,本稿では学習データ全体の強調音声の F0 の性質を利用し,閾値を自動で決定する手法を提案する.客観評価および主観評価実験から提案法の有効性を示す.
	（英）	This paper describes automatic prosodic context labeling of training data for synthesizing expressive speech in HMM-based speech synthesis framework by focusing on emphasis expression. We have proposed unsuper- vised labeling technique with emphasis context using the property of the difference between original and generated F0 patterns. In this approach, there is a problem that the threshold which is used to judge whether a phrase is emphasized or not has to be pre-determined. To overcome this problem, we propose a technique for determining an optimal threshold automatically based on a behavior of F0 pattern in emphatic speech. Experimental results show that the proposed technique gives a similar result to the labeling obtained by subjectively and the emphasis expression is well reproduced in synthetic speech.
キーワード	（和）	HMM音声合成 / スタイル音声合成 / 強調表現 / 韻律コンテキスト / 自動ラベリング / / /
	（英）	HMM-based speech synthesis / expressive speech / emphasis expression / unsupervised labeling / / / /
文献情報		信学技報, vol. 112, no. 81, SP2012-33, pp. 1-6, 2012年6月.
資料番号		SP2012-33
発行日		2012-06-07 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		SP2012-33

研究会情報
研究会	SP
開催期間	2012-06-14 - 2012-06-15
開催地（和）	NTT厚木研究開発センタ
開催地（英）	NTT Atsugi R&D Center
テーマ（和）	音声知覚生成/聴覚コミュニケーション，一般(音響学会聴覚研究会共催）
テーマ（英）	Speech perception, production, auditory communication, etc.
講演論文情報の詳細
申込み研究会	SP
会議コード	2012-06-SP
本文の言語	日本語
タイトル（和）	強調音声合成のための局所韻律コンテキスト自動付与の検討
サブタイトル（和）
タイトル（英）	A Study on Automatic Prosodic Context Labeling for Emphatic Speech Synthesis
サブタイトル（英）
キーワード(1)（和/英）	HMM音声合成 / HMM-based speech synthesis
キーワード(2)（和/英）	スタイル音声合成 / expressive speech
キーワード(3)（和/英）	強調表現 / emphasis expression
キーワード(4)（和/英）	韻律コンテキスト / unsupervised labeling
キーワード(5)（和/英）	自動ラベリング /
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	前野悠 / Yu Maeno / マエノユウ
第1著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Tech)
第2著者氏名（和/英/ヨミ）	能勢隆 / Takashi Nose / ノセタカシ
第2著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Tech)
第3著者氏名（和/英/ヨミ）	小林隆夫 / Takao Kobayashi / コバヤシタカオ
第3著者所属（和/英）	東京工業大学 (略称：東工大) Tokyo Institute of Technology (略称： Tokyo Tech)
第4著者氏名（和/英/ヨミ）	井島勇祐 / Yusuke Ijima / イジマユウスケ
第4著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT)
第5著者氏名（和/英/ヨミ）	中嶋秀治 / Hideharu Nakajima / ナカジマヒデハル
第5著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT)
第6著者氏名（和/英/ヨミ）	水野秀之 / Hideyuki Mizuno / ミズノヒデユキ
第6著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT)
第7著者氏名（和/英/ヨミ）	吉岡理 / Osamu Yoshioka / ヨシオカオサム
第7著者所属（和/英）	日本電信電話株式会社 (略称： NTT) NTT Corporation (略称： NTT)
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
第21著者氏名（和/英/ヨミ）	/ /
第21著者所属（和/英）	(略称： ) (略称： )
第22著者氏名（和/英/ヨミ）	/ /
第22著者所属（和/英）	(略称： ) (略称： )
第23著者氏名（和/英/ヨミ）	/ /
第23著者所属（和/英）	(略称： ) (略称： )
第24著者氏名（和/英/ヨミ）	/ /
第24著者所属（和/英）	(略称： ) (略称： )
第25著者氏名（和/英/ヨミ）	/ /
第25著者所属（和/英）	(略称： ) (略称： )
第26著者氏名（和/英/ヨミ）	/ /
第26著者所属（和/英）	(略称： ) (略称： )
第27著者氏名（和/英/ヨミ）	/ /
第27著者所属（和/英）	(略称： ) (略称： )
第28著者氏名（和/英/ヨミ）	/ /
第28著者所属（和/英）	(略称： ) (略称： )
第29著者氏名（和/英/ヨミ）	/ /
第29著者所属（和/英）	(略称： ) (略称： )
第30著者氏名（和/英/ヨミ）	/ /
第30著者所属（和/英）	(略称： ) (略称： )
第31著者氏名（和/英/ヨミ）	/ /
第31著者所属（和/英）	(略称： ) (略称： )
第32著者氏名（和/英/ヨミ）	/ /
第32著者所属（和/英）	(略称： ) (略称： )
第33著者氏名（和/英/ヨミ）	/ /
第33著者所属（和/英）	(略称： ) (略称： )
第34著者氏名（和/英/ヨミ）	/ /
第34著者所属（和/英）	(略称： ) (略称： )
第35著者氏名（和/英/ヨミ）	/ /
第35著者所属（和/英）	(略称： ) (略称： )
第36著者氏名（和/英/ヨミ）	/ /
第36著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2012-06-14 11:00:00
発表時間	30分
申込先研究会	SP
資料番号	SP2012-33
巻番号（vol）	vol.112
号番号（no）	no.81
ページ範囲	pp.1-6
ページ数	6
発行日	2012-06-07 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会