お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
研究会 開催スケジュール
技報閲覧サービス
[ログイン]
技報アーカイブ
    [Japanese] / [English] 
研究会名/開催地/テーマ  )→
 
講演検索  検索語:  /  範囲:題目 著者 所属 抄録 キーワード )→

すべての研究会開催スケジュール  (検索条件: すべての年度)

講演検索結果
 登録講演(開催プログラムが公開されているもの)  (日付・降順)
 20件中 1~20件目  /   
研究会 発表日時 開催地 タイトル・著者 抄録 資料番号
NS, IN
(併催)
2024-03-01
11:35
沖縄 沖縄コンベンションセンター 多段階情報処理システムにおけるVM移動制御への深層強化学習の適用
糀谷友貴岡山大)・中根和俊名大)・樽谷優弥岡山大)・策力木格電通大)・計 宇生NII)・横平徳美岡山大)・村瀬 勉名大)・福島行信岡山大IN2023-87
本稿では,多段階情報処理システムを対象として,情報処理タスクの進捗度(正確性)を極力高めることを目的としたVM(Virt... [more] IN2023-87
pp.130-135
CS, CQ
(併催)
2023-05-18
15:10
香川 レクザムホール(香川県県民ホール)
(ハイブリッド開催,主:現地開催,副:オンライン開催)
デッドラインアウェアなジョブのポリシー勾配法を用いたスケジューリングにおける無効ジョブの選別性能について
匂阪竜也・○塩本公平東京都市大)・栗本 崇NIICQ2023-1
データセンター間の通信分野でデータを転送する場合,デッドラインと呼ばれる期限を考慮してデータを転送するデッドラインアウェ... [more] CQ2023-1
pp.1-6
CCS, NLP
(共催)
2022-06-09
13:50
大阪 大阪大学 豊中キャンパス シグマホール
(ハイブリッド開催,主:現地開催,副:オンライン開催)
PPOにおける対称な制約条件の適用による学習性能の改善
岩谷尚輝中野秀洋東京都市大NLP2022-3 CCS2022-3
深層強化学習は経験から最適行動を学習するアルゴリズムである。その一種であるProximal Policy Optimiz... [more] NLP2022-3 CCS2022-3
pp.13-16
NC, MBE
(併催)
2021-03-04
16:50
ONLINE オンライン開催 A3Cにおける決定論的方策勾配の導入
高萩 悠山内ゆかり日大NC2020-63
Mnihらは,Asynchronous Advantage Actor-Critic (A3C)と呼ばれる学習手法を提起... [more] NC2020-63
pp.117-120
PN 2020-08-25
10:50
ONLINE オンライン開催 広域データセンター間通信における深層強化学習を適用したPolicy Gradientによるデッドラインアウェアなデータ転送
能登谷将紀塩本公平東京都市大)・栗本 崇NIIPN2020-21
デッドラインアウェアなジョブのスケジューリング問題は,科学的ワークフローや商用データセンタの広域ネットワークなどの応用分... [more] PN2020-21
pp.49-56
PN 2020-03-03
09:00
鹿児島 奄美市社会福祉センター
(開催中止,技報発行あり)
広域データセンター間通信のトラフィック特性を考慮したジョブスケジューリング法の検討
荒川隆志塩本公平東京都市大)・栗本 崇NIIPN2019-61
近年,データセンターの発達によりデータセンター間広域通信網(DC-WAN)を効率的に使用する需要が高まっている.
また... [more]
PN2019-61
pp.51-58
RCS 2019-06-19
14:55
沖縄 宮古島 平良港ターミナルビル 方策勾配型強化学習を用いたEDCAにおける送信遅延時間短縮の検討
新﨑聖峰香田優介山本高至西尾理志守倉正博京大RCS2019-52
無線LAN(Local Area Network)におけるQoS(Quality of Service)制御を行う方式と... [more] RCS2019-52
pp.91-96
MSS, NLP
(併催)
2018-03-12
14:00
大阪 大阪大学豊中キャンパス Learning in Two-Player Matrix Games by Policy Gradient Lagging Anchor
Shiyao DingToshimitsu UshioOsaka Univ.MSS2017-79
We propose a novel multi-agent reinforcement learning (MARL)... [more] MSS2017-79
pp.11-14
IBISML 2016-11-16
15:00
京都 京都大学 混合ガウス分布を用いたサンプルクラスタリングに基づく方策探索
矢野泰樹前田新一京大IBISML2016-46
EM-based Policy Hyper Parameter Exploration (EPHE)(Wang et a... [more] IBISML2016-46
pp.9-15
IBISML 2016-11-17
14:00
京都 京都大学 Importance Weight Aware Updateによる逐次的自然方策勾配推定
岩城 諒阪大)・横山裕樹玉川大)・浅田 稔阪大IBISML2016-81
自然方策勾配法などの強化学習の成功には,適切な学習率の設定が不可欠である.確率的勾配法の適応的学習率として提案された O... [more] IBISML2016-81
pp.251-257
IBISML 2012-11-07
15:30
東京 筑波大学 東京キャンパス文京校舎 Gaussian process regressionを用いた確率的方策に対する方策勾配法
中村 泰石黒 浩阪大IBISML2012-52
近年, ガウス過程回帰を用いて価値関数の学習を行う強化学習法が提案されてきた [1]. ガウス過程を用い たベイズ推論に... [more] IBISML2012-52
pp.129-133
IBISML 2011-11-09
15:45
奈良 奈良女子大学 Modified Newton Approach to Policy Search
Hirotaka HachiyaTokyo Inst. of Tech.)・Tetsuro MorimuraIBM Japan)・Takaki MakinoUniv. of Tokyo)・Masashi SugiyamaTokyo Inst. of Tech.IBISML2011-54
 [more] IBISML2011-54
pp.79-85
IBISML 2011-06-21
14:15
東京 武田ホール Analysis and Improvement of Policy Gradient Estimation
Tingting ZhaoHirotaka HachiyaGang NiuMasashi SugiyamaTokyo Inst. of Tech.IBISML2011-12
Policy gradient is a useful model-free reinforcement learnin... [more] IBISML2011-12
pp.83-89
NC, MBE
(併催)
2009-03-11
16:35
東京 玉川大学 方策勾配法によるCPGに基づいたエネルギー効率の良い二足歩行の学習
東 良行柴田智広奈良先端大NC2008-125
多リンク,多関節を有するロボットを少ない自由度で簡便に制御するために,しばしばCPG(Central Pattern G... [more] NC2008-125
pp.129-134
NC, NLP
(共催)
2008-06-27
17:05
沖縄 琉球大学 非定常環境における自己組織化強化学習
日栄 悠奈良先端大)・森 健京大)・石井 信京大/奈良先端大NC2008-30
実世界の環境は一般に非定常であり,最適制御は時間によって変化する.このような制御を,定常なマルコフ決定過程を仮定する強化... [more] NC2008-30
pp.97-101
NC, MBE
(併催)
2008-03-13
14:10
東京 玉川大学 確率的パラメータを持つ方策関数に対する方策勾配法
中村 泰阪大NC2007-170
強化学習の一種である方策勾配法は, 方策関数のパラメータ, すなわち方策パラメータを, 方策勾配に基づき更新する手法であ... [more] NC2007-170
pp.343-348
NC, MBE
(併催)
2008-03-14
13:20
東京 玉川大学 ガウス過程を用いた能動サンプリングに基づく強化学習法
竹田和博森 健奈良先端大)・石井 信京大NC2007-192
強化学習では一般に、良い方策を獲得するために多くのサンプルを生成する必
要がある。このことは、実
ロボットなどの制... [more]
NC2007-192
pp.473-478
MBE, NC
(併催)
2007-12-22
16:10
愛知 名古屋大学 平均報酬の多様体に基づく方策勾配法
松原崇充奈良先端大/ATR-CNS)・森本 淳JST-ICORP,ATR-CNSNC2007-85
本稿では,方策のパラメータ空間においてパラメータ変化が及ぼす平均報酬の変化を量る計量に基づく方策勾配型強化学習法を提案す... [more] NC2007-85
pp.81-86
NC 2007-06-15
09:25
沖縄 沖縄科学技術研究基盤整備機構 内部状態を用いた強化学習によるマルチエージェント系における協調行動の獲得
谷口雄基森 健石井 信奈良先端大NC2007-15
本報告では, 内部状態を用いた強化学習法により, 部分観測環境のもとでマルチエージェントによる協調行動が効率良く実現でき... [more] NC2007-15
pp.41-45
NC 2007-03-14
15:30
東京 玉川大学 非マルコフ決定過程における方策勾配法の一考察 ~ カーリングの事例 ~
五十嵐治一芝浦工大)・石原聖司近畿大)・木村昌臣芝浦工大
強化学習には価値ベースと方策ベースの2つのアプローチがある.VAPSアルゴリズムは両者の統一を目指したアルゴリズムである... [more] NC2006-148
pp.179-184
 20件中 1~20件目  /   
ダウンロード書式の初期値を指定してください NEW!!
テキスト形式 pLaTeX形式 CSV形式 BibTeX形式
著作権について : 以上の論文すべての著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会