講演抄録/キーワード |
講演名 |
2021-03-29 15:40
Depthwise Separable Convolutionを適用した省パラメータな3DCNN ○伊藤功騎・中野秀洋・宮内 新(東京都市大) CCS2020-27 |
抄録 |
(和) |
Convolutional Neural Network(CNN)は画像,音声等様々な分野で成果を挙げている.近年,2Dの画像の他に3Dの動画像の分野でも用いられるようになった.しかし,これらの3次元CNNアーキテクチャは特定のタスクの最高精度を競う形で進化していったモデルであり,計算量やパラメータ数に関してはあまり議論されていない.この事実が3次元CNNの応用の障害になっている.
本研究では,3Dの情報を扱うネットワークの中でも,パラメータ数を大幅に削減でき,なおかつ認識精度にも大きな違いが見られない3次元CNNアーキテクチャを提案する.動画内の人物の動作を認識するタスクで実験したところ,94.6%のパラメータ数削減に成功した. |
(英) |
Convolutional Neural Networks (CNNs) have been used in various fields such as image and speech. In recent years, CNNs have been used not only for 2D images but also for 3D video images.
However, these 3-Dimensional CNN (3DCNN) architectures are models that have evolved to compete for the highest accuracy in specific tasks, and the computational complexity and number of parameters have not been discussed so far. This fact has become an obstacle to the application of 3DCNNs.
In this paper, we propose a 3DCNN architecture that can drastically reduce the number of parameters and still maintain the same recognition accuracy among networks that handle 3D information. In our experiments, we have succeeded in reducing the number of parameters by 94.6% in the task of human action recognition. |
キーワード |
(和) |
深層学習 / 畳み込みニューラルネットワーク / 人物行動推定 / Depthwise Separable Convolution / / / / |
(英) |
Deep Learning / Convolutional Neural Network / Human Action Recognition / Depthwise Separable Convolution / / / / |
文献情報 |
信学技報, vol. 120, no. 438, CCS2020-27, pp. 37-41, 2021年3月. |
資料番号 |
CCS2020-27 |
発行日 |
2021-03-22 (CCS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
CCS2020-27 |