お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-03-07 14:00
マルコフ性を明示的に考慮したCTCネットワークの提案
河内祐太浅見太一山口義和青野裕司NTTIBISML2016-111
抄録 (和) 確率モデル不要な真のニューラルend-to-end音声認識実現に対して,音声書き起こし以外の言語リソースを利用できない現状のニューラル音響モデルは問題である.これを解決する,系列分類タスクに対する汎用的なモデルとして,connectionist temporal classification (CTC)をベースとし,出力結果の保持機構と,出力シンボルのbigramを明示的に表現する行列とを持ったモデルを提案する.実験では,出力のbigram性を利用することによって解ける問題を定義し,パラメータの意味づけに成功するとともに,通常のLSTM-CTCに対して精度向上を確認した. 
(英) Current neural acoustic models are incapable of utilizing language resources except speech transcriptions. So toward the realization of true neural end-to-end speech recognition, this property is problematic. In this paper, we present a method for general sequence classification task based on connectionist temporal classification with a structure keeping the previously output symbols and a matrix explicitly represents bigram properties. In our experiment, we defined a problem easily solved by using Markov properties of output sequences. Finally we could obtain interpretable neural network parameters and accuracy improvements from the baseline LSTM-CTC model.
キーワード (和) 系列分類 / 深層学習 / CTC / end-to-end / / / /  
(英) temporal classification / deep learning / CTC / end-to-end / / / /  
文献情報 信学技報, vol. 116, no. 500, IBISML2016-111, pp. 83-88, 2017年3月.
資料番号 IBISML2016-111 
発行日 2017-02-27 (IBISML) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード IBISML2016-111

研究会情報
研究会 IBISML  
開催期間 2017-03-06 - 2017-03-07 
開催地(和) 東京工業大学 
開催地(英) Tokyo Institute of Technology 
テーマ(和) 統計数理,機械学習,データマイニング,一般 
テーマ(英) Statistical Mathematics, Machine Learning, Data Mining, etc. 
講演論文情報の詳細
申込み研究会 IBISML 
会議コード 2017-03-IBISML 
本文の言語 日本語 
タイトル(和) マルコフ性を明示的に考慮したCTCネットワークの提案 
サブタイトル(和)  
タイトル(英) CTC network with explicit representation vector of Markov property 
サブタイトル(英)  
キーワード(1)(和/英) 系列分類 / temporal classification  
キーワード(2)(和/英) 深層学習 / deep learning  
キーワード(3)(和/英) CTC / CTC  
キーワード(4)(和/英) end-to-end / end-to-end  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 河内 祐太 / Yuta Kawachi / カワチ ユウタ
第1著者 所属(和/英) 日本電信電話(株) (略称: NTT)
NTT MedNTT Corporationia Intelligence Laboratories (略称: NTT)
第2著者 氏名(和/英/ヨミ) 浅見 太一 / Taichi Asami / アサミ タイチ
第2著者 所属(和/英) 日本電信電話(株) (略称: NTT)
NTT MedNTT Corporationia Intelligence Laboratories (略称: NTT)
第3著者 氏名(和/英/ヨミ) 山口 義和 / Yoshikazu Yamaguchi / ヤマグチ ヨシカズ
第3著者 所属(和/英) 日本電信電話(株) (略称: NTT)
NTT MediaNTT Corporation Intelligence Laboratories (略称: NTT)
第4著者 氏名(和/英/ヨミ) 青野 裕司 / Yushi Aono / アオノ ユウシ
第4著者 所属(和/英) 日本電信電話(株) (略称: NTT)
NTT Corporation (略称: NTT)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2017-03-07 14:00:00 
発表時間 30分 
申込先研究会 IBISML 
資料番号 IBISML2016-111 
巻番号(vol) vol.116 
号番号(no) no.500 
ページ範囲 pp.83-88 
ページ数
発行日 2017-02-27 (IBISML) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会