お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2015-03-03 10:45
[ポスター講演]多人数会話におけるマルチモーダル音源数推定
若林佑幸中山雅人西浦敬信山下洋一立命館大EA2014-120 SIP2014-161 SP2014-183
抄録 (和) 音源数はブラインド音源分離や部分空間法を用いた音源定位推定において重要な役割を果たす.音源分離では分離数,音源定位推定では信号部分空間の次元を決定するために、音源数が用いられる.音源数が実音源数と異なる場合,分離性能や定位性能が劣化する.そのため,これらの分野において音源数は既知であると仮定されている.
しかし,人間同士の自然な会話において事前に音源数を知ることは困難である.
一方,近年マルチモーダル信号処理に関するアプローチに注目が集まっている.音声や視線やジェスチャ,触覚などのように異なるセンサから受信された信号を統合することにより単一の信号による手法と比較し,性能の改善,制約の緩和,問題の簡略化が期待される.
本稿では,音響情報と画像情報との統合によるマルチモーダル信号処理に注目し,多人数会話におけるマルチモーダル音源数推定について提案し,評価を行った.音響情報から空間スペクトル尤度を,画像情報からはそのモデルを推定し,そのスペクトル距離を利用し,音源数の推定を行った.提案手法による推定結果では従来手法と比較し,大きく精度が改善された. 
(英) Source number plays an important role in blind source separation (BSS) and sound source localization (SSL) based on subspace approach and is used in order to determined the number of separation signals in BSS and the dimension of the signal subspace in SSL. In these fields, it is assumed that source number is given.
However, it is impossible to know the number in natural conversations. Recently attention is focused on multi-modal signal processing.
Integration between signals received by different sensors, for example an acoustic signal and an image signal, enables to simplify a difficult problem and to improve the performance of the signal processing, compared with single signal processing. This paper proposes multi-modal source number estimation in multi-party conversations by using acoustic and image information.
Experiments shows the proposed method outperforms the conventional method.
キーワード (和) 音源数推定 / MUSIC法 / マルチモーダル信号処理 / 多人数会話 / / / /  
(英) Source Number Estimation / MUSIC Method / Multi-modal Signal Processing / Multi-party Conversations / / / /  
文献情報 信学技報, vol. 114, no. 474, SIP2014-161, pp. 267-272, 2015年3月.
資料番号 SIP2014-161 
発行日 2015-02-23 (EA, SIP, SP) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード EA2014-120 SIP2014-161 SP2014-183

研究会情報
研究会 SIP EA SP  
開催期間 2015-03-02 - 2015-03-03 
開催地(和) ホテルミヤヒラ(石垣島) 
開催地(英)  
テーマ(和) 電気音響,音声,信号処理一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SIP 
会議コード 2015-03-SIP-EA-SP 
本文の言語 日本語 
タイトル(和) 多人数会話におけるマルチモーダル音源数推定 
サブタイトル(和)  
タイトル(英) Multimodal source number estimation in multi-party conversations 
サブタイトル(英)  
キーワード(1)(和/英) 音源数推定 / Source Number Estimation  
キーワード(2)(和/英) MUSIC法 / MUSIC Method  
キーワード(3)(和/英) マルチモーダル信号処理 / Multi-modal Signal Processing  
キーワード(4)(和/英) 多人数会話 / Multi-party Conversations  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 若林 佑幸 / Yukoh Wakabayashi / ワカバヤシ ユウコウ
第1著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第2著者 氏名(和/英/ヨミ) 中山 雅人 / Masato Nakayama / ナカヤマ マサト
第2著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第3著者 氏名(和/英/ヨミ) 西浦 敬信 / Takanobu Nishiura / ニシウラ タカノブ
第3著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第4著者 氏名(和/英/ヨミ) 山下 洋一 / Yoichi Yamashita / ヤマシタ ヨウイチ
第4著者 所属(和/英) 立命館大学 (略称: 立命館大)
Ritsumeikan University (略称: Ritsumeikan Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2015-03-03 10:45:00 
発表時間 90分 
申込先研究会 SIP 
資料番号 EA2014-120, SIP2014-161, SP2014-183 
巻番号(vol) vol.114 
号番号(no) no.473(EA), no.474(SIP), no.475(SP) 
ページ範囲 pp.267-272 
ページ数
発行日 2015-02-23 (EA, SIP, SP) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会