電子情報通信学会技術研究報告

Print edition: ISSN 0913-5685      Online edition: ISSN 2432-6380

Volume 114, Number 365

音声

開催日 2014-12-15 - 2014-12-16 / 発行日 2014-12-08

[PREV] [NEXT]

[TOP] | [2011] | [2012] | [2013] | [2014] | [2015] | [2016] | [2017] | [Japanese] / [English]

[PROGRAM] [BULK PDF DOWNLOAD]


目次

SP2014-106
Recognition and Analysis of Emotion in Indonesian Conversational Speech
○Nurul Lubis・Sakriani Sakti・Graham Neubig・Tomoki Toda(NAIST)・Dessi Lestari・Ayu Purwarianti(ITB)・Satoshi Nakamura(NAIST)
pp. 1 - 6

SP2014-107
会議音声における音声区間検出のためのDeep Neural Networkとクロス適応の検討
○中谷彰宏(静岡大)・王 龍標(長岡技科大)・甲斐充彦(静岡大)
pp. 19 - 24

SP2014-108
[招待講演]Dialogue state tracking in statistical dialogue management
○Kai Yu・Lu Chen(SJTU)
pp. 25 - 29

SP2014-109
[招待講演]統計モデルに基づいた柔軟な音声合成 ~ 人間のように喋る機械の実現を目指して ~
○徳田恵一(名工大/Google)
p. 31

SP2014-110
発音クラスタリングを目的とした基準発音距離の定義と発音距離予測に用いる音響特徴量の実験的検討
○笠原 駿(東大)・史 天澤(清華大)・峯松信明・齋藤大輔・広瀬啓吉(東大)
pp. 47 - 52

SP2014-111
Articulatory Controllable Speech Modification using Sequential Inversion and Production Mapping with Gaussian Mixture Models
○Patrick Lumban Tobing・Tomoki Toda・Graham Neubig・Sakriani Sakti・Satoshi Nakamura(NAIST)・Ayu Purwarianti(ITB)
pp. 57 - 62

SP2014-112
HMMを用いた日本人英語音声合成における話者性を保持した韻律補正
○大島悠司・高道慎之介・戸田智基・Graham Neubig・Sakriani Sakti・中村 哲(奈良先端大)
pp. 63 - 68

SP2014-113
MFCC領域におけるGMMクラスタリングを併用したNon-negative Matrix Factorizationによる雑音環境下音声認識
○藤垣健太郎・柏木陽佑・齋藤大輔・峯松信明・広瀬啓吉(東大)
pp. 69 - 74

SP2014-114
Multiple Non-negative Matrix Factorizationを用いた多対一声質変換
○相原 龍・滝口哲也・有木康雄(神戸大)
pp. 75 - 80

SP2014-115
音声入力に基づく韻律制御機能を有するHMM音声合成システム
○西垣友理・高道慎之介・戸田智基・ニュービック グラム・サクリアニ サクティ・中村 哲(奈良先端大)
pp. 81 - 86

SP2014-116
雑音環境下における特徴量重み付きマルチモーダル声質変換
○真坂健太・相原 龍・滝口哲也・有木康雄(神戸大)
pp. 87 - 92

SP2014-117
複数出力サブネットワークを有するディープニューラルネットワークに基づく声質変換
○橋本哲弥・柏木陽佑・齋藤大輔・広瀬啓吉・峯松信明(東大)
pp. 99 - 104

SP2014-118
話者コードに基づく話者正規化学習を利用したニューラルネット音響モデルの適応
○柏木陽佑・齋藤大輔・峯松信明・広瀬啓吉(東大)
pp. 105 - 110

SP2014-119
[ポスター講演]DNNに基づく特徴変換による残響環境話者認識
○張 兆峰・王 龍標(長岡技科大)・甲斐充彦(静岡大)・李 衛鋒(清華大)・岩橋政宏(長岡技科大)
pp. 111 - 116

SP2014-120
[ポスター講演]GMMとDNNを組み合わせた遠隔環境下での母国語認識
○坂上綾太・王 龍標・張 兆峰・パーパツタナブリ コムデット・岩橋政宏(長岡技科大)
pp. 123 - 128

SP2014-121
[ポスター講演]speech selection and environmental adaptation for asynchronous speech recording based on deep neural network
○Bo Ren・Longbiao Wang(Nagaoka Univ. of Tech.)・Atsuhiko Kai(Shizuoka Univ.)
pp. 129 - 134

SP2014-122
音声クエリの複数認識結果を用いた音声中の検索語検出
○大島聡史・伊藤義明(岩手県立大)
pp. 135 - 140

SP2014-123
講演音声における発話形式の違いを考慮した話者認識手法の検討
○中辻康太(同志社大)・西田昌史(名大)・山本誠一(同志社大)
pp. 141 - 146

SP2014-124
[ポスター講演]relationship between speakers' characteristics and the information transmission quality in Dialog
○Bohan Chen(Nagoya Univ.)・Norihide Kitaoka(Tokushima Univ.)・Kazuya Takeda(Nagoya Univ.)
pp. 147 - 152

SP2014-125
[ポスター講演]調音クラスの事後確率に基づく言語識別の検討
○平田拓海・高木一幸(電通大)
pp. 153 - 157

SP2014-126
[ポスター講演]話者適応型Restricted Boltzmann Machineを用いた声質変換の検討
○中鹿 亘・滝口哲也・有木康雄(神戸大)
pp. 165 - 170

注: 本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.


IEICE / 電子情報通信学会