お知らせ 【メンテナンスのお知らせ】4月25日(木)10:00から1時間半ほど、メンテナンス作業を予定しております。作業の間はconnpassのご利用が出来ません。ご迷惑をおかけしますが何卒ご了承ください。

お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。
なお有料の対象となるのはAPIのみであり、connpassのサービスにつきましては今後も無料でご利用いただけます。

このエントリーをはてなブックマークに追加

5月

21

第38回 強化学習アーキテクチャ勉強会

主催 : 山川宏

第38回 強化学習アーキテクチャ勉強会
募集内容

参加者

無料

先着順
34/50

申込者
Kenshi Abe
hei4
saruta
NaokiUchida91
yabuchanchan
ryan
k-coffee
Tamaki Okui
non
mabo
申込者一覧を見る
開催日時
2019/05/21(火) 19:15 ~ 20:30
募集期間

2019/05/17(金) 23:50 〜
2019/05/21(火) 20:30まで

会場

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

マップで見る

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

会場の注意点

  • DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります
  • 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません)
  • 19:00頃になると正面口(本郷通り沿い)にロックがかかりますので,もし19:00をすぎる場合には,裏側の階段から3階に上がって頂く形になります.

ご協力の程,よろしくお願いいたします.

スケジュール

  • 19:15〜19:20 オープニング
  • 19:20〜20:10 論文紹介 NoRML: No-Reward Meta Learning

講演概要:

発表者:中田勇介(千葉大学)

  • タイトル:論文紹介 NoRML: No-Reward Meta Learning

  • アブストラクト
    強化学習は多くの試行錯誤を要するためシミュレータ上で学習を行うことが多い.しかし,シミュレータと実環境のダイナミクスは必ずしも等しくないため,あるタスクをシミュレータ上で遂行できる方策が,同じタスクを実環境で遂行できるとは限らない. 実環境で使用可能な方策を得る方法として,シミュレータで多くの試行錯誤を通して学習した方策を,実環境での少量の試行錯誤を通して適応させる方法が考えられる.具体的には,実環境における報酬の獲得量を最大化するよう強化学習を用いて方策を更新すれば良い.しかし,実環境で得られる観測から報酬を与えることが困難なタスクが多く存在する.例えば,画像入力に基づいて物体を持ち上げるタスクを考える.この時,シミュレータ上では,対象とする物体の座標が簡単に得られるため,物体の座標に基づいて報酬を与えることが出来る.しかし,画像入力しか得られない実環境においては適切に報酬を与えることが出来ず,方策を適応させることが出来ない.本発表で紹介するNoRMLは,強化学習で方策を適応させる時に報酬を要しないMeta Learning手法を提案した.実験では,既存のMeta Learning手法であるMAML[2]と比較して優れた性能を示すことが確認されている.

  • 参考文献
    [1] Yang, Y., Caluwaerts, K., Iscen, A., Tan, J., & Finn, C. (2019). NoRML: No-Reward Meta Learning. CoRR, abs/1903.01063.
    [2] Finn, Chelsea, Pieter Abbeel, and Sergey Levine. "Model-agnostic meta-learning for fast adaptation of deep networks." Proceedings of the 34th International Conference on Machine Learning-Volume 70. JMLR. org, 2017.

フィード

rl_architecture

rl_architectureさんが資料をアップしました。

2019/07/02 19:39

rl_architecture

rl_architecture さんが 第38回 強化学習アーキテクチャ勉強会 を公開しました。

2019/05/17 23:50

第38回 強化学習アーキテクチャ勉強会 has been published!

グループ

強化学習アーキテクチャ勉強会

イベント数 54回

メンバー数 1008人

終了

2019/05/21(火)

19:15
20:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2019/05/17(金) 23:50 〜
2019/05/21(火) 20:30

会場

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

管理者

参加者(34人)

Kenshi Abe

Kenshi Abe

第38回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

hei4

hei4

第38回 強化学習アーキテクチャ勉強会に参加を申し込みました!

saruta

saruta

第38回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

NaokiUchida91

NaokiUchida91

I joined 第38回 強化学習アーキテクチャ勉強会!

yabuchanchan

yabuchanchan

第38回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ryan

ryan

第38回 強化学習アーキテクチャ勉強会に参加を申し込みました!

k-coffee

k-coffee

第38回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Tamaki Okui

Tamaki Okui

第38回 強化学習アーキテクチャ勉強会に参加を申し込みました!

mabo

mabo

第38回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

参加者一覧(34人)

キャンセルした人(14人)