お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2012-03-12 16:50
ショット内及びショット間の画像・音声特徴に着目したスピーチショット抽出
熊谷章吾道満恵介名大)・高橋友和岐阜聖徳学園大)・出口大輔井手一郎村瀬 洋名大IE2011-147 MVE2011-109
抄録 (和) 本報告では,ショット内及びショット間の特徴に基づく被写体と話者の異同判定によるニュース映像からのスピーチショット抽出手法を提案する.
スピーチショットはマルチメディア情報を豊富に含み,資料的価値が高い.
そこで我々はこれまで,被写体の口唇動作と話者の声から得られる複数の音声特徴と画像特徴の相関に基づく被写体と話者の異同判定手法を提案してきた.
この手法は,音声ノイズの少ないショットに対しては高精度な異同判定が可能であるが,多量の音声ノイズを含むショットに対しての異同判定は困難であった.
そこで本報告では,2段階の処理による被写体と話者の異同判定手法を提案する.
まず第1段階で,これまでに提案した手法により異同判定を行う.
その後,第2段階で,ショット内及びその前後のショットとの間に表れる特徴的な画像・音声の性質に基づいて異同判定を行う.
スピーチショット抽出実験の結果,提案手法の有効性を確認した. 
(英) We propose a method to extract speech shots from news videos using detecting the inconsisteny between a subject and the speaker focusing on features within and between shots.
Speech shots in news videos contain a wealth of multimedia information, and are valuable as archived material.
To extract speech shots, we have previously proposed a method to detect the inconsistency between a subject and the speaker based on the co-occurrence between a subject's lip motion and the speaker's voice.
This previous method could detect the inconsistency in a shot with little audio noises.
However, it is difficult to detect the inconsistency in a shot with significant amount of audio noises.
In order to deal with this problem, the proposed method detects the inconsisteny between a subject and the speaker in two steps.
The first step detects the inconsistency by our previous method, and the second step detects the inconsistency based on the intra- and inter- shot features.
Experimental results showed the effectiveness of the proposed method.
キーワード (和) スピーチショット抽出 / ニュース映像 / 映像検索 / 画像・音声特徴 / / / /  
(英) Speech shot extraction / news video / video retrieval / audio-visual features / / / /  
文献情報 信学技報, vol. 111, no. 479, MVE2011-109, pp. 81-86, 2012年3月.
資料番号 MVE2011-109 
発行日 2012-03-05 (IE, MVE) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード IE2011-147 MVE2011-109

研究会情報
研究会 IE MVE  
開催期間 2012-03-12 - 2012-03-13 
開催地(和) 富山大学 
開催地(英) Toyama University 
テーマ(和) 五感メディアの品質,コミュニケーションデザイン,画像符号化,食メディア,一般 
テーマ(英) Quality of Five Senses Media, Communication Design, Image Coding, Food Media, General Area 
講演論文情報の詳細
申込み研究会 MVE 
会議コード 2012-03-IE-MVE 
本文の言語 日本語 
タイトル(和) ショット内及びショット間の画像・音声特徴に着目したスピーチショット抽出 
サブタイトル(和)  
タイトル(英) Extraction of Speech Shots Focusing on Visual and Audio Features within and between Shots 
サブタイトル(英)  
キーワード(1)(和/英) スピーチショット抽出 / Speech shot extraction  
キーワード(2)(和/英) ニュース映像 / news video  
キーワード(3)(和/英) 映像検索 / video retrieval  
キーワード(4)(和/英) 画像・音声特徴 / audio-visual features  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 熊谷 章吾 / Shogo Kumagai / クマガイ ショウゴ
第1著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第2著者 氏名(和/英/ヨミ) 道満 恵介 / Keisuke Doman / ドウマン ケイスケ
第2著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第3著者 氏名(和/英/ヨミ) 高橋 友和 / Tomokazu Takahashi / タカハシ トモカズ
第3著者 所属(和/英) 岐阜聖徳学園大学 (略称: 岐阜聖徳学園大)
Gifu Shotoku Gakuen University (略称: Gifu Shotoku Gakuen Univ.)
第4著者 氏名(和/英/ヨミ) 出口 大輔 / Daisuke Deguchi / デグチ ダイスケ
第4著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第5著者 氏名(和/英/ヨミ) 井手 一郎 / Ichiro Ide / イデ イチロウ
第5著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第6著者 氏名(和/英/ヨミ) 村瀬 洋 / Hiroshi Murase / ムラセ ヒロシ
第6著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2012-03-12 16:50:00 
発表時間 25分 
申込先研究会 MVE 
資料番号 IE2011-147, MVE2011-109 
巻番号(vol) vol.111 
号番号(no) no.478(IE), no.479(MVE) 
ページ範囲 pp.81-86 
ページ数
発行日 2012-03-05 (IE, MVE) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会