講演抄録/キーワード |
講演名 |
2011-08-04 14:00
音韻構造を考慮したHMM手話認識における音韻ストリーム重みの最適化手法の検討 ○酒向慎司・北村 正(名工大) WIT2011-25 |
抄録 |
(和) |
手話認識の分野では,隠れマルコフモデル(hidden Markov model; HMM)に基づいた手法がいくつか提案されている.我々は,手話の構成素 (サブユニッ ト)を様々な手話映像から自動分類し,それらの組合せから単語モデルを構成する手法を提案してきた.これまでの研究では,サブユニットの生成過程に手話の音韻構造を考慮することで,学習の効率化や認識率の改善が示されているが,音韻の重要度に相当する各ストリームの重みをモデル全体で一定値に定めていた.最適なストリーム重みを網羅的に調べ,事前に付与することは,実用的な観点からすると現実的ではない.本報告では,未知データに対しても頑健に働くような適切なストリーム重みを,学習データに基づいて推定する手法を検討し,手話単語の認識タスクにおける評価実験について報告する. |
(英) |
We work on automatic Japanese sign Language (JSL) recognition using
Hidden Markov Model (HMM). An important issue for modeling sign is that how to determine the constituent element of sign (i.e., subunit) like ``phoneme'' in spoken language. We focused on special feature of sign language that JSL is composed of three types of phonological elements which is hand local information, position, and movement. In this report, we propose a method for estimate the stream weight of multi-stream HMM which is correspond to phonological elements. An isolated words recognition experiment has confirmed the effectiveness of our proposed method. |
キーワード |
(和) |
手話認識 / サブユニット / 音韻構造 / マルチストリームHMM / ストリーム重み最適化 / / / |
(英) |
sign language recognition / multi-stream HMM / subunit / phonology / stream-weight optimization / / / |
文献情報 |
信学技報, vol. 111, no. 174, WIT2011-25, pp. 25-30, 2011年8月. |
資料番号 |
WIT2011-25 |
発行日 |
2011-07-28 (WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
WIT2011-25 |
研究会情報 |
研究会 |
WIT |
開催期間 |
2011-08-04 - 2011-08-05 |
開催地(和) |
京大杉浦ホール |
開催地(英) |
Sugiura Community Care Res. Center |
テーマ(和) |
聴覚障害および一般(連催:HI学会SIGDE,SIGACI,SIGNOI) |
テーマ(英) |
Well-being Information Technology, etc |
講演論文情報の詳細 |
申込み研究会 |
WIT |
会議コード |
2011-08-WIT |
本文の言語 |
日本語 |
タイトル(和) |
音韻構造を考慮したHMM手話認識における音韻ストリーム重みの最適化手法の検討 |
サブタイトル(和) |
|
タイトル(英) |
A study on stream-weight optimization method for HMM-based sign language recognition using phonemic structure |
サブタイトル(英) |
|
キーワード(1)(和/英) |
手話認識 / sign language recognition |
キーワード(2)(和/英) |
サブユニット / multi-stream HMM |
キーワード(3)(和/英) |
音韻構造 / subunit |
キーワード(4)(和/英) |
マルチストリームHMM / phonology |
キーワード(5)(和/英) |
ストリーム重み最適化 / stream-weight optimization |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
酒向 慎司 / Shinji Sako / サコウ シンジ |
第1著者 所属(和/英) |
名古屋工業大学 (略称: 名工大)
Nagoya Institute of Technology (略称: NIT) |
第2著者 氏名(和/英/ヨミ) |
北村 正 / Tadashi Kitamura / |
第2著者 所属(和/英) |
名古屋工業大学 (略称: 名工大)
Nagoya Institute of Technology (略称: NIT) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-08-04 14:00:00 |
発表時間 |
30分 |
申込先研究会 |
WIT |
資料番号 |
WIT2011-25 |
巻番号(vol) |
vol.111 |
号番号(no) |
no.174 |
ページ範囲 |
pp.25-30 |
ページ数 |
6 |
発行日 |
2011-07-28 (WIT) |