講演抄録/キーワード |
講演名 |
2019-10-18 10:15
ウェアラブルな全方位カメラの画像を入力とした3Dポーズ推定 ~ 手話の認識と翻訳に向けて ~ ○三浦哲平・酒向慎司(名工大) PRMU2019-32 |
抄録 |
(和) |
手話は,ろう者が日常のコミュニケーションに用いる言語である.しかし,健聴者で手話を扱える者は少なく,両者間の会話は筆談や手話通訳者を介さなければならない.より対話的で,直接意思を伝え合うコミュニケーションを日常の生活でおこなうためには,携帯して常に使える手話の認識,翻訳システムが必要である.手話は手指の形や動きだけでなく,目・眉・口や周囲の環境などの空間全体を使って意思を表現する.本研究では,手話の表現に用いる空間の情報を取得できること,手話者が日常的に携帯して使えることを考慮して,ウェアラブルな全方位カメラを用いた手話の認識と翻訳について検討している.本稿では特に,手話者の動作を認識するための,ウェアラブルな全方位カメラで取得した画像を入力とした 3D ポーズ推定を提案する.3D ポーズ推定には畳込みニューラルネットワーク (CNN) の VNect を参考にしたモデルを用いる.全方位カメラで取得した手話の画像と,画像に同期した 3D ポーズのデータセットを新たに収集し,そのデータセットによるモデルの学習と評価をおこなう. |
(英) |
|
キーワード |
(和) |
3D ポーズ推定 / 3D 関節座標推定 / 全方位カメラ / ウェアラブル / 手話 / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 119, no. 235, PRMU2019-32, pp. 5-10, 2019年10月. |
資料番号 |
PRMU2019-32 |
発行日 |
2019-10-11 (PRMU) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2019-32 |