12月21日(月) 午前 【開会挨拶】 10:00 - 10:10 |
|
- |
|
12月21日(月) 午前 【Session-1 音響モデル】 10:10 - 11:50 |
(1) |
10:10-10:35 |
音声認識のための非線形スペクトル変換を用いた話者適応 |
○林 豊大・南角吉彦・李 晃伸・徳田恵一(名工大) |
(2) |
10:35-11:00 |
話者不変な相対関係特徴を音響単位とする音響モデリングに関する実験的検討 |
○齋藤大輔・松浦 良・峯松信明・広瀬啓吉(東大) |
(3) |
11:00-11:25 |
Unsupervised speaker adaptation for Speech-to-Speech Translation system *
Keiichiro Oura, Junichi Yamagishi, Mirjam Wester, Simon King, Keiichi Tokuda (NITECH) |
(4) |
11:25-11:50 |
音声認識のための複数の認識器を利用した能動学習 *
濱中 悠三 (東工大), 江森 正 (NEC情報システムズ), 越仲 孝文 (NEC/東工大), 篠田 浩一 (東工大), 古井 貞熙 (東工大) |
12月21日(月) 午後 【Session-2 デコーダ】 13:00 - 13:50 |
(5) |
13:00-13:25 |
Recent Evaluations of a WFST-Based Speech Recognition Decoder |
○Paul R. Dixon・Josef R. Novak・Tasuku Oonishi・Sadaoki Furui(Tokyo Inst. of Tech.) |
(6) |
13:25-13:50 |
サーチエラーリスク最小化に基づくViterbiビーム探索とその評価 |
○堀 貴明・渡部晋治・中村 篤(NTT) |
12月21日(月) 午後 【Session-3 言語モデル】 13:50 - 14:40 |
(7) |
13:50-14:15 |
マルチタスク型音声対話システムの対話制御のための発話識別 *
○粟野 健太郎, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) |
(8) |
14:15-14:40 |
Topic Dependent Language Model based on On-Line Voting *
○Welly Naptali, Masatoshi Tsuchiya, Seiichi Nakagawa (Toyohashi University of Technology) |
12月21日(月) 午後 【Session-4 招待講演】 14:55 - 15:45 |
(9) |
14:55-15:45 |
[招待講演]何かが欠けている音声認識研究 |
○古井貞熙(東工大) |
12月21日(月) 午後 【Session-5 パネル討論】 15:45 - 17:00 |
|
- |
討論テーマ:「音声認識研究に何が必要か?」
モデレータ:河原達也(京大)
招待講演やASRU最新動向を踏まえて,若手研究者とともに
これからの音声認識の挑戦課題・研究方法等について討論する. |
12月22日(火) 午前 【Session-6 韻律・VAD】 09:30 - 10:45 |
(10) |
09:30-09:55 |
母音間のピッチデルタと発話インターバルを用いた焦燥検知 ~ 現実に基づいた正確な検知を目指して ~ |
○岡田一秀(トヨタ自動車) |
(11) |
09:55-10:20 |
複数の特徴量による条件付確率場に基づく音声区間検出 |
○斎藤 彰・南角吉彦・李 晃伸・徳田恵一(名工大) |
(12) |
10:20-10:45 |
Dirichlet事前分布を用いた音声区間検出の検討 *
○藤本 雅清, 渡部 晋治, 中谷 智広 (NTT) |
12月22日(火) 午前 【Session-7 対話】 11:00 - 12:15 |
(13) |
11:00-11:25 |
音声対話システムのためのN-gramに基づくキーワードからの文生成 |
○吉見孔孝・南角吉彦・李 晃伸・徳田恵一(名工大) |
(14) |
11:25-11:50 |
音声対話システムの対話履歴N-gramを利用したユーザ満足度推定手法 *
原 直, 北岡 教英, 武田 一哉 (名大) |
(15) |
11:50-12:15 |
対話データの統計量を用いたPOMDPによる対話制御 *
○南 泰浩, 目黒 豊美, 東中 竜一郎, 森 啓, 堂坂 浩二, 前田 英作 (NTT) |
12月22日(火) 午後 【Session-8 招待講演】 13:15 - 14:05 |
(16) |
13:15-14:05 |
[招待講演]対話インタラクションの文化パラメータ *
片桐 恭弘 (はこだて未来大) |
12月22日(火) 午後 【Session-9 音声検索・要約】 14:20 - 15:35 |
(17) |
14:20-14:45 |
文脈を考慮した確率的モデルによる話し言葉の整形 *
○Graham Neubig, 秋田 祐哉, 森 信介, 河原 達也 (京大) |
(18) |
14:45-15:10 |
Web上の語彙を利用した音声クエリ拡張による検索語検出 |
○栗城吾央・伊藤慶明・小嶋和徳・石亀昌明(岩手県立大)・田中和世(筑波大)・李 時旭(産総研) |
(19) |
15:10-15:35 |
複数音声認識システムを用いた音声中の検索語検出の検討 *
○名取 賢, 西崎 博光, 関口 芳廣 (山梨大) |
12月22日(火) 午後 【Session-10 一般(ポスターセッション)】 15:50 - 17:50 |
(20) |
15:50-17:50 |
音声認識の信頼度に着目した文境界検出に関する検討 *
○畑 昇吾 (千葉大), 西田 昌史 (同志社大), 堀内 靖雄, 黒岩 眞吾 (千葉大) |
(21) |
15:50-17:50 |
Buried Markov Model を用いた音声認識モデルの構築法の検討 *
○山本 隆之, 滝口 哲也, 有木 康雄 (神戸大) |
(22) |
15:50-17:50 |
ランダムプロジェクションを用いた音響モデルの線形変換 *
○吉井 麻里子, 滝口 哲也, 有木 康雄 (神戸大) |
(23) |
15:50-17:50 |
直交関数系の級数展開に基づくスペクトル引き算 |
○赤坂泰司・島村徹也(埼玉大) |
(24) |
15:50-17:50 |
音声信号の2重自己相関関数のスペクトル表現とその雑音環境下単語認識システムへの応用 |
○Nguyen Ngoc Dinh・島村徹也(埼玉大) |
(25) |
15:50-17:50 |
F0量子化に基づく韻律コンテキストを用いたHMM音声合成 |
○大木康次郎・能勢 隆・小林隆夫(東工大) |
(26) |
15:50-17:50 |
ユーザの発話を利用した聞き取りやすい英語への音声変換手法 |
○小柴侑一・榑松 明・白井克彦(早大) |
(27) |
15:50-17:50 |
順位統計量を用いた話者照合のためのコホート話者選択方法 *
○岡本 悠 (千葉大), 柘植 覚 (徳島大), 堀内 靖雄, 黒岩 眞吾 (千葉大) |
(28) |
15:50-17:50 |
距離感を与える音声の特徴分析と合成 |
○大町 基・岩田和彦・小林哲則(早大) |
(29) |
15:50-17:50 |
多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討 |
○中鹿 亘(神戸大)・立花隆輝・西村雅史(日本IBM)・滝口哲也・有木康雄(神戸大) |
(30) |
15:50-17:50 |
F0量子化と非パラレル学習に基づく声質変換の検討 |
○太田悠平・能勢 隆・小林隆夫(東工大) |
(31) |
15:50-17:50 |
多様な声質を表現するための因子分析モデルに基づくHMM音声合成 |
○鹿住恭介・南角吉彦・徳田恵一(名工大) |
(32) |
15:50-17:50 |
WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価 *
○増村 亮, 伊藤 仁, 伊藤 彰則, 牧野 正三 (東北大) |
(33) |
15:50-17:50 |
Google N-gramを用いた音声認識のタスク汎用性評価の試み *
久保 慶伍, 三宅 純平, 川波 弘道, 猿渡 洋, 鹿野 清宏 (奈良先端大) |
(34) |
15:50-17:50 |
AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 |
○宮本千琴・駒井祐人・滝口哲也・有木康雄(神戸大)・李 義昭(追大)・中林稔堯(神戸大) |
(35) |
15:50-17:50 |
英語発音評定における各種正規化の検討 *
○久住 大, 加藤 正治, 小坂 哲夫, 松永 到 (山形大) |
(36) |
15:50-17:50 |
ユーザ生成型音声対話コンテンツを用いた音声情報案内システム |
○福田敏則・吉見孔孝・南角吉彦・李 晃伸・徳田恵一(名工大) |
(37) |
15:50-17:50 |
音声認識・言語理解システムを用いた音声対話コーパスの収集とその利用 *
○小野 正貴 (東京農工大), 中野 有紀子 (成蹊大) |
(38) |
15:50-17:50 |
共通部分単語の提示を併用した単語音声入力インタフェース *
○張 用起, 甲斐 充彦, 王 龍標 (静岡大) |
(39) |
15:50-17:50 |
騒音環境下における音声帯域と単語了解度の関係について |
○栗原祥子・日和崎祐介・佐々木茂明・羽田陽一(NTT) |
(40) |
15:50-17:50 |
One study of reasonable acoustic attachment for mute image
-- To Target accurate Automatic Iipreading -- |
○Kazuhide Okada(Toyota) |
(41) |
15:50-17:50 |
人類進化のデジタル符号化要求仮説 *
○得丸 公明 (システム・エンジニア) |