お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2021-06-18 15:00
[ポスター講演]スペクトルとケプストラムの時系列特徴を用いた深層学習による悲鳴検知
福森隆寛立命館大SP2021-6
抄録 (和) 平静音声と悲鳴の分類は,音響監視システムを実現する上で欠かせない技術である.近年は深層ニューラルネットワークを用いて悲鳴を検知する手法が提案されているが,Mel-frequency Cepstral Coefficientsやメルスペクトルなどの低次元特徴量をネットワークの入力に用いられていることが多い.本稿では,高次元特徴量であるスペクトルとケプストラムの時系列特徴を融合した悲鳴検知手法を提案する.本研究では,畳み込みニューラルネットワーク (CNN: Convolutional Neural Network ),ゲート付きリカレントニューラルユニット (GRU: Gated Recurrent Unit),および,これらを統合したネットワーク (CNN--GRU)の3種類のネットワーク構造を比較する.実際の平静音声と悲鳴から構成される音声コーパスを用いて提案した特徴学習手法の有効性を検証した.雑音環境下における評価実験の結果,提案したスペクトルとケプストラムの時系列特徴に基づいたCNN-GRUが,単一の特徴量に基づいたネットワークよりも優れた分類精度を達成した.この結果は,悲鳴検知だけでなく,音響イベント検出における音声の発話状態推定に高次元特徴量が有効であることも示唆している. 
(英) Discrimination between normal speech and scream is crucial in audio surveillance and monitoring. Although deep neural networks are used in recent methods, traditional low-level speech features are applied, such as mel-frequency cepstral coefficients and the mel spectrum. This paper proposes a scream detection method that fuses high-dimensional time-sequential features in spectral and cepstral domains. We compare the following three types of architectures as base networks: convolutional neural networks (CNNs), gated recurrent unit (GRU) networks, and their combination (CNN-GRU). Using a corpus comprising real normal speech and scream, we present a comprehensive comparison with conventional methods to verify the effectiveness of the proposed feature learning method. The results of experiments conducted in various noisy environments demonstrate that the CNN-GRU based on our spectral-and-cepstral features achieves better classification performance than single feature-based networks. This finding suggests the effectiveness of using high-dimensional sources for speech-type recognition in sound event detection.
キーワード (和) 悲鳴 / スペクトル / ケプストラム / 時系列特徴 / 深層学習 / / /  
(英) scream / spectrum / cepstrum / time-sequential feature / deep learning / / /  
文献情報 信学技報, vol. 121, no. 66, SP2021-6, pp. 31-36, 2021年6月.
資料番号 SP2021-6 
発行日 2021-06-11 (SP) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SP2021-6

研究会情報
研究会 SP IPSJ-SLP IPSJ-MUS  
開催期間 2021-06-18 - 2021-06-19 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 音学シンポジウム2021 
テーマ(英) OTOGAKU Symposium 2021 
講演論文情報の詳細
申込み研究会 SP 
会議コード 2021-06-SP-SLP-MUS 
本文の言語 日本語 
タイトル(和) スペクトルとケプストラムの時系列特徴を用いた深層学習による悲鳴検知 
サブタイトル(和)  
タイトル(英) Scream detection based on deep learning using time-sequential spectral and cepstral features 
サブタイトル(英)  
キーワード(1)(和/英) 悲鳴 / scream  
キーワード(2)(和/英) スペクトル / spectrum  
キーワード(3)(和/英) ケプストラム / cepstrum  
キーワード(4)(和/英) 時系列特徴 / time-sequential feature  
キーワード(5)(和/英) 深層学習 / deep learning  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 福森 隆寛 / Takahiro Fukumori / フクモリ タカヒロ
第1著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第2著者 氏名(和/英/ヨミ) / /
第2著者 所属(和/英) (略称: )
(略称: )
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2021-06-18 15:00:00 
発表時間 120分 
申込先研究会 SP 
資料番号 SP2021-6 
巻番号(vol) vol.121 
号番号(no) no.66 
ページ範囲 pp.31-36 
ページ数
発行日 2021-06-11 (SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会