講演抄録/キーワード |
講演名 |
2016-10-16 14:55
距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識 ○橋村佳祐・齊藤剛史(九工大) WIT2016-36 |
抄録 |
(和) |
我々は,シーンよりフレーム画像を取り出してタイル状に連結して一枚の画像(フレーム連結画像)を作成し,フレーム連結画像を入力としてCNNを用いて認識する手法を提案している.本稿では,手話シーンより取得できる距離画像を用いた手話シーン向けのフレーム連結画像,およびフレーム連結画像を用いたCNNによる手話単語認識手法を提案する.Kinectセンサにより取得された手話単語100語の手話シーンを用いて認識実験を実施した結果,右手のみを用いたフレーム連結画像で最も高い認識率を得た.この精度は手の位置や動きを考慮した従来手法よりも高い認識精度であり,提案手法の有効性を確認した. |
(英) |
We proposed a concatenated frame image (CFI) that some sampled frame images from the scene are concatenated like a two-dimensional tile, and proposed a framework of CFI-based convolutional neural network (CNN). In this paper, we propose an improved CFI for sign language scene and CFI-based CNN for sign language recognition (SLR). The proposed method was evaluated with 100 words of sign language acquired by Kinect sensor. As the result, right-hand based CFI obtained the highest recognition accuracy. This performance is better than the traditional method which involved not only the hand shape but also hand location and its movement. It is confirmed that the proposed method is efficient for SLR. |
キーワード |
(和) |
手話認識 / 距離画像 / Convolutional Neural Network / フレーム連結画像 / / / / |
(英) |
Sign language recognition / depth image / convolutional neural network / concatenated sequence image / / / / |
文献情報 |
信学技報, vol. 116, no. 248, WIT2016-36, pp. 17-22, 2016年10月. |
資料番号 |
WIT2016-36 |
発行日 |
2016-10-09 (WIT) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
WIT2016-36 |
研究会情報 |
研究会 |
WIT |
開催期間 |
2016-10-16 - 2016-10-17 |
開催地(和) |
唐津ロイヤルホテル(佐賀県唐津市) |
開催地(英) |
Karatsu Royal Hotel (Saga pref.) |
テーマ(和) |
福祉情報工学、人間工学、一般 |
テーマ(英) |
Ergonomics and Well-being Information Technology, etc. |
講演論文情報の詳細 |
申込み研究会 |
WIT |
会議コード |
2016-10-WIT |
本文の言語 |
日本語 |
タイトル(和) |
距離画像のフレーム連結画像を用いたConvolutional Neural Networkによる手話単語認識 |
サブタイトル(和) |
|
タイトル(英) |
Sign language recognition by convolutional neural network with concatenated sequence image of depth image |
サブタイトル(英) |
|
キーワード(1)(和/英) |
手話認識 / Sign language recognition |
キーワード(2)(和/英) |
距離画像 / depth image |
キーワード(3)(和/英) |
Convolutional Neural Network / convolutional neural network |
キーワード(4)(和/英) |
フレーム連結画像 / concatenated sequence image |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
橋村 佳祐 / Keisuke Hashimura / ハシムラ ケイスケ |
第1著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech) |
第2著者 氏名(和/英/ヨミ) |
齊藤 剛史 / Takeshi Saitoh / サイトウ タケシ |
第2著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: kyutech) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2016-10-16 14:55:00 |
発表時間 |
20分 |
申込先研究会 |
WIT |
資料番号 |
WIT2016-36 |
巻番号(vol) |
vol.116 |
号番号(no) |
no.248 |
ページ範囲 |
pp.17-22 |
ページ数 |
6 |
発行日 |
2016-10-09 (WIT) |