講演抄録/キーワード |
講演名 |
2018-05-25 09:20
深度画像を用いた深層強化学習によるミリ波通信のトラヒック制御の検討 ○三熊智哉・西尾理志・守倉正博(京大)・淺井裕介・宮武 遼(NTT) MoNA2018-1 |
抄録 |
(和) |
ミリ波通信は見通し通信路が人体等で遮蔽されることで通信品質が急峻に低下する.そこで,RGB-Dカメラから人体遮蔽を予測して基地局(AP:Access Point)と通信中の端末(STA:Station)の合計スループット(システムスループット)を増加させるトラヒック制御がこれまで提案されている.しかし,既存研究では具体的にどの状態でどのような制御をするべきかを,設置した個々の環境にあわせて人手で設計する必要がある.本稿ではこの問題に対処するため,深層強化学習によるトラヒック制御システムを提案する.提案方式により,RGB-Dカメラから得られる深度画像やプロキシサーバ上のトラヒックバッファの状態をもとに,システムスループットを増加させる制御方法を試行錯誤により探索し獲得する.実験により,提案方式では学習時間の経過に伴い,システムスループットが学習前に比べて増加することを示した.また,遮蔽を考慮した制御を行わない方式に比べて,提案方式を用いることでシステムスループットが高くなることを示した. |
(英) |
In millimeter-wave (mmWave) communications, throughput is decreased seriously when line-of-sight paths are blocked by human bodies. In order to solve the throughput degradation problem, a proactive traffic control system based on RGB-D camera images has been proposed. The system predicts the human blockages and controls data transmission to each STA in order to increase the system throughput. The previous works employ the heuristic traffic control strategy which requires manual tuning suitable for a specific wireless communication environment. In order to solve the problem, this paper proposes a traffic control system with deep reinforcement learning using depth images obtained from an RGB-D camera and states of traffic buffers in a proxy server. The proposed system explores the optimal traffic control strategy appropriate to a wireless communication environment autonomously through trial and error, and it is expected to obtain a traffic control strategy improving the system throughput. The performance of the proposed traffic control system is evaluated by experiments. The experimental results show that the proposed system increases the system throughput as the learning progresses. In addition, the proposed system achieves higher performance compared with a simple heuristic algorithm. |
キーワード |
(和) |
ミリ波通信 / IEEE 802.11ad / 人体遮蔽 / RGB-Dカメラ / 深層強化学習 / / / |
(英) |
mmWave communication / IEEE 802.11ad / human blockage / RGB-D camera / deep reinforcement learning / / / |
文献情報 |
信学技報, vol. 118, no. 56, MoNA2018-1, pp. 159-164, 2018年5月. |
資料番号 |
MoNA2018-1 |
発行日 |
2018-05-18 (MoNA) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
MoNA2018-1 |