研究会 |
発表日時 |
開催地 |
タイトル・著者 |
抄録 |
資料番号 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-15 09:30 |
神奈川 |
東工大(すずかけ台) |
Recognition and Analysis of Emotion in Indonesian Conversational Speech ○Nurul Lubis・Sakriani Sakti・Graham Neubig・Tomoki Toda(NAIST)・Dessi Lestari・Ayu Purwarianti(ITB)・Satoshi Nakamura(NAIST) SP2014-106 |
The importance of incorporating emotional aspect in human co... [more] |
SP2014-106 pp.1-6 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-15 10:45 |
神奈川 |
東工大(すずかけ台) |
会議音声における音声区間検出のためのDeep Neural Networkとクロス適応の検討 ○中谷彰宏(静岡大)・王 龍標(長岡技科大)・甲斐充彦(静岡大) SP2014-107 |
音声区間検出(VAD)では, 雑音や残響の影響によりVAD性能が大幅に低下するため, そのような環境に対して頑健なVAD... [more] |
SP2014-107 pp.19-24 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-15 13:10 |
神奈川 |
東工大(すずかけ台) |
[招待講演]Dialogue state tracking in statistical dialogue management ○Kai Yu・Lu Chen(SJTU) SP2014-108 |
(事前公開アブストラクト) Dialogue state tracking (DST) is a process to ... [more] |
SP2014-108 pp.25-29 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-15 14:00 |
神奈川 |
東工大(すずかけ台) |
[招待講演]統計モデルに基づいた柔軟な音声合成 ~ 人間のように喋る機械の実現を目指して ~ ○徳田恵一(名工大/Google) SP2014-109 |
本講演では,統計的パラメトリック音声合成について述べる.人間の
ように喋る機械を実現するためには,任意の話者の声,様々... [more] |
SP2014-109 p.31 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-15 19:20 |
神奈川 |
東工大(すずかけ台) |
発音クラスタリングを目的とした基準発音距離の定義と発音距離予測に用いる音響特徴量の実験的検討 ○笠原 駿(東大)・史 天澤(清華大)・峯松信明・齋藤大輔・広瀬啓吉(東大) SP2014-110 |
国際語となった英語について,「英語利用者が従うべき標準的な英語を設けるのではなく,英語が多様化した現状を受け入れる」世界... [more] |
SP2014-110 pp.47-52 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
Articulatory Controllable Speech Modification using Sequential Inversion and Production Mapping with Gaussian Mixture Models ○Patrick Lumban Tobing・Tomoki Toda・Graham Neubig・Sakriani Sakti・Satoshi Nakamura(NAIST)・Ayu Purwarianti(ITB) SP2014-111 |
In this report, we propose an articulatory controllable spee... [more] |
SP2014-111 pp.57-62 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
HMMを用いた日本人英語音声合成における話者性を保持した韻律補正 ○大島悠司・高道慎之介・戸田智基・Graham Neubig・Sakriani Sakti・中村 哲(奈良先端大) SP2014-112 |
日本語母語話者の話者性を反映した英語音声合成用音響モデルを構築するためには,日本人英語(ERJ:English Read... [more] |
SP2014-112 pp.63-68 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
MFCC領域におけるGMMクラスタリングを併用したNon-negative Matrix Factorizationによる雑音環境下音声認識 ○藤垣健太郎・柏木陽佑・齋藤大輔・峯松信明・広瀬啓吉(東大) SP2014-113 |
雑音環境下音声認識において,事例ベースの特徴量強調としてNon-negative Matrix Factorizatio... [more] |
SP2014-113 pp.69-74 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
Multiple Non-negative Matrix Factorizationを用いた多対一声質変換 ○相原 龍・滝口哲也・有木康雄(神戸大) SP2014-114 |
本報告では,非負値行列因子分解(NMF)を拡張したMultiple Non-negative Matrix Factor... [more] |
SP2014-114 pp.75-80 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
音声入力に基づく韻律制御機能を有するHMM音声合成システム ○西垣友理・高道慎之介・戸田智基・ニュービック グラム・サクリアニ サクティ・中村 哲(奈良先端大) SP2014-115 |
音声合成を用いた創作活動の活発化により,目標とする特定話者の音声の合成処理において,ユーザの思い通りの音声を合成できるイ... [more] |
SP2014-115 pp.81-86 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
雑音環境下における特徴量重み付きマルチモーダル声質変換 ○真坂健太・相原 龍・滝口哲也・有木康雄(神戸大) SP2014-116 |
声質変換は,入力した音声を音韻情報などは保ったまま,話者性のような特定の情報のみを変換する技術であり,話者変換や感情変換... [more] |
SP2014-116 pp.87-92 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
複数出力サブネットワークを有するディープニューラルネットワークに基づく声質変換 ○橋本哲弥・柏木陽佑・齋藤大輔・広瀬啓吉・峯松信明(東大) SP2014-117 |
(事前公開アブストラクト) 本研究では、任意話者への変換に向けてのDeep Neural Network(DNN) によ... [more] |
SP2014-117 pp.99-104 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 11:00 |
神奈川 |
東工大(すずかけ台) |
話者コードに基づく話者正規化学習を利用したニューラルネット音響モデルの適応 ○柏木陽佑・齋藤大輔・峯松信明・広瀬啓吉(東大) SP2014-118 |
近年,自動音声認識において,その高い認識性能により,deep neural network (DNN) を用いた音響モデ... [more] |
SP2014-118 pp.105-110 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]DNNに基づく特徴変換による残響環境話者認識 ○張 兆峰・王 龍標(長岡技科大)・甲斐充彦(静岡大)・李 衛鋒(清華大)・岩橋政宏(長岡技科大) SP2014-119 |
(事前公開アブストラクト) 本研究はディープニューラルネット(DNN)に基づく残響環境話者認識の研究である。DNNに基づ... [more] |
SP2014-119 pp.111-116 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]GMMとDNNを組み合わせた遠隔環境下での母国語認識 ○坂上綾太・王 龍標・張 兆峰・パーパツタナブリ コムデット・岩橋政宏(長岡技科大) SP2014-120 |
(事前公開アブストラクト) 話し手の発話から母国語を認識し,話し手の母国語に合わせた音響モデルを用い音声認識することで,... [more] |
SP2014-120 pp.123-128 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]ディープニューラルネットワークに基づく音声選択と環境適応による非同期音声収録の音声認識 ○任 波・王 龍標(長岡技科大)・甲斐充彦(静岡大) SP2014-121 |
本稿では、非同期の音声収録を用いた頑健な遠隔発話音声認識システムを提案する.携帯端末を使用したアプリケーションへの注目は... [more] |
SP2014-121 pp.129-134 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
音声クエリの複数認識結果を用いた音声中の検索語検出 ○大島聡史・伊藤義明(岩手県立大) SP2014-122 |
国際評価型ワークショップNTCIR-11では音声で話されたクエリ(検索語)を音声ドキュメント中から検出を行うSQ-STD... [more] |
SP2014-122 pp.135-140 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
講演音声における発話形式の違いを考慮した話者認識手法の検討 ○中辻康太(同志社大)・西田昌史(名大)・山本誠一(同志社大) SP2014-123 |
話者認識技術は,討論音声などの多人数会話の音声データに対して,議事録の自動作成や話者毎の発話検索のために必要とされている... [more] |
SP2014-123 pp.141-146 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]対話者間の音声特徴類似度と対話の情報伝達効果の関係 ○陳 伯翰(名大)・北岡教英(徳島大)・武田一哉(名大) SP2014-124 |
本稿では,対話者間の音声特徴類似度と対話の情報伝達効果の関係を調査する.そのためHCRCマップタスクのデータを利用する.... [more] |
SP2014-124 pp.147-152 |
NLC, IPSJ-NL (連催) SP, IPSJ-SLP, JSAI-SLUD (連催,共催) (併催) [詳細] |
2014-12-16 13:30 |
神奈川 |
東工大(すずかけ台) |
[ポスター講演]調音クラスの事後確率に基づく言語識別の検討 ○平田拓海・高木一幸(電通大) SP2014-125 |
言語識別とは,入力音声に対しその言語が何語であるかを自動的に判別する技術である.言語識別では言語を区別する特徴の抽出が重... [more] |
SP2014-125 pp.153-157 |