講演抄録/キーワード |
講演名 |
2019-06-19 14:55
方策勾配型強化学習を用いたEDCAにおける送信遅延時間短縮の検討 ○新﨑聖峰・香田優介・山本高至・西尾理志・守倉正博(京大) RCS2019-52 |
抄録 |
(和) |
無線LAN(Local Area Network)におけるQoS(Quality of Service)制御を行う方式として,IEEE 802.11eではEDCA(Enhanced Distributed Channel Access)方式が規定されている.本稿では,それぞれのAP(Access Point)が一定の高優先度パケットを送信する状況を考える.このとき,AP全てが高優先度パケットの送信を完了する時間の最小化を目的とする.そのためにEDCA方式において,高優先度パケットが他のアクセスカテゴリ(AC:Access Category)にも分類可能であるとする.その上で,AP全てが高優先度パケットの送信を完了する時間を最小化するために最適な分類則を獲得する.
ここで,それぞれのAPにおける高優先度パケットの送信を完了する時間を最小化しても,全てのAPにおける高優先度パケットの送信を完了する時間を最小化できるとは限らない.そのため,AP全てが高優先度パケットの送信を完了する時間を最小化するために,全てのAPが協力することを考える.そこで中央制御局が,それぞれのAPに到着したパケットをACに分類する.
このとき,他のAPの情報も考慮する必要があるため,最適な分類則の獲得は困難である.そのため本稿では,最適な分類則を経験的に獲得するために,強化学習を用いることを提案する.更に,強化学習のうち方策勾配法を用いることで学習を進められることを示す.その上で,学習を進めるための方策を設計する.シミュレーション評価では,提案方式が従来のEDCA方式と比較して送信遅延時間が小さいことを示す. |
(英) |
This paper proposes a packet mapping algorithm among Access Categories (ACs) in Enhanced Distributed Channel Access (EDCA) scheme based on policy gradient Reinforcement Learning (RL).In EDCA scheme based on an autonomous distributed control, high priority packets obtain more transmission opportunity than low priority packets.The arrival rate of high priority packets can be higher than that of low priority packets.In such a situation, mapping high priority packets to the AC defined in EDCA scheme is not necessarily the best mapping algorithm to minimize the transmission delay of high priority packets.
Therefore, we assume that EDCA scheme can map high priority packets to any AC.Although each AP sends high priority packets early, however, APs can not always send high priority packets early.This paper proposes policy gradient RL to empirically obtain optimal mapping algorithm.By using the mapping algorithm based on RL, simulation results reveal that the transmission delay can be reduced.The average transmission delay of the proposed mapping algorithm is 13.8% smaller than that of the conventional mapping algorithm.Moreover, the average transmission delay of the proposed mapping algorithm is 5.2% smaller than that of the heuristic mapping algorithm. |
キーワード |
(和) |
IEEE 802.11e / EDCA / 強化学習 / 方策勾配法 / / / / |
(英) |
IEEE 802.11e / EDCA / reinforcement learning / policy gradient / / / / |
文献情報 |
信学技報, vol. 119, no. 90, RCS2019-52, pp. 91-96, 2019年6月. |
資料番号 |
RCS2019-52 |
発行日 |
2019-06-12 (RCS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
RCS2019-52 |
|