講演抄録/キーワード |
講演名 |
2019-03-15 13:30
[ポスター講演]重畳音声分離向け聴覚音声特徴量抽出のためのラダー型デノイジングスパースオートエンコーダの実装設計と評価 ○関口 浩・成末義哲・森川博之(東大) EA2018-155 SIP2018-161 SP2018-117 |
抄録 |
(和) |
霊長類や哺乳類が外界の重畳音を聞き分ける際には,聴覚神経系において時間推移の類似性が高い聴覚音声特徴量包絡群を同一の音源と判断する時間同期検知クラスタリングが重要な役割を担っている.この時間同期検知クラスタリングが適切に機能するための要件は,聴覚音声特徴量抽出が互いに確率的に独立な信号群を生成すること,種々の外界音を特徴量に変換可能な非線形性を有することの2点である.本稿では,この2つの要件を実現する聴覚音声特徴量抽出の数理モデル,実装,および特性評価について述べる.数理モデルには,非線形スパースエンコーダデコーダモデルを選択し,その実装には,ラダー型デノイジングスパースオートエンコーダ(LDAE)を使用する.音声で学習させたLDAEネットワークにテスト用音声を入力し,その出力である聴覚音声特徴量の発生確率が互いに独立であることを示す. |
(英) |
Primates and mammalian distinguish overlapped speech sounds from one another by recognizing a single sound source whether temporal contour of auditory speech features in auditory neurons are similar.This is called as temporal synchronization detection and clustering function. The performance of this detection and clustering function depends on the former function that is auditory speech feature extraction. The feature extraction is needed to satisfy two requirements: 1) auditory speech features are mutually stochastic independent and 2) the feature extraction should allow various complicated sounds to be represented, which leads to non-linearity.This paper introduces non-linear sparse encoder decoder model as computational model, implements it with a ladder network, and finally evaluate that network behavior. We show that our trained network can output auditory speech features that are mutually stochastic independent. |
キーワード |
(和) |
ラダーネットワーク / 音声分離 / 聴覚脳神経学 / 聴覚音声特徴量抽出 / 確率論的独立性 / / / |
(英) |
Ladder Network / Speech Separation / Auditory Neuroscience / Auditory Speech Feature Extraction / stochastic independence / / / |
文献情報 |
信学技報, vol. 118, no. 497, SP2018-117, pp. 329-333, 2019年3月. |
資料番号 |
SP2018-117 |
発行日 |
2019-03-07 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2018-155 SIP2018-161 SP2018-117 |
研究会情報 |
研究会 |
EA SIP SP |
開催期間 |
2019-03-14 - 2019-03-15 |
開催地(和) |
アイランド ナガサキ(長崎市) |
開催地(英) |
i+Land nagasaki (Nagasaki-shi) |
テーマ(和) |
応用/電気音響,信号処理,音声,一般 |
テーマ(英) |
Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2019-03-EA-SIP-SP |
本文の言語 |
日本語 |
タイトル(和) |
重畳音声分離向け聴覚音声特徴量抽出のためのラダー型デノイジングスパースオートエンコーダの実装設計と評価 |
サブタイトル(和) |
|
タイトル(英) |
Design and Evaluation of Ladder Denoising Autoencoder for Auditory Speech Feature Extraction of Overlapped Speech Separation |
サブタイトル(英) |
|
キーワード(1)(和/英) |
ラダーネットワーク / Ladder Network |
キーワード(2)(和/英) |
音声分離 / Speech Separation |
キーワード(3)(和/英) |
聴覚脳神経学 / Auditory Neuroscience |
キーワード(4)(和/英) |
聴覚音声特徴量抽出 / Auditory Speech Feature Extraction |
キーワード(5)(和/英) |
確率論的独立性 / stochastic independence |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
関口 浩 / Hiroshi Sekiguchi / セキグチ ヒロシ |
第1著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第2著者 氏名(和/英/ヨミ) |
成末 義哲 / Yoshiaki Narusue / ナルスエ ヨシアキ |
第2著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第3著者 氏名(和/英/ヨミ) |
森川 博之 / Hiroyuki Morikawa / モリカワ ヒロユキ |
第3著者 所属(和/英) |
東京大学 (略称: 東大)
The University of Tokyo (略称: Univ. of Tokyo) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2019-03-15 13:30:00 |
発表時間 |
90分 |
申込先研究会 |
SP |
資料番号 |
EA2018-155, SIP2018-161, SP2018-117 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.495(EA), no.496(SIP), no.497(SP) |
ページ範囲 |
pp.329-333 |
ページ数 |
5 |
発行日 |
2019-03-07 (EA, SIP, SP) |
|