FakeOwlのブログ
FakeOwlのブログ
読者になる

FakeOwlのブログ

2018-10-11から1日間の記事一覧

2018-10-11

Reinforcement Learning for Improving Agent Design :エンジニアが忘れてはいけないことを思い出させてくれた。

Reinforcement Learning

David Ha, Reinforcement Learning for Improving Agent Design のメモ https://arxiv.org/abs/1810.03779 この論文では、総報酬を最大化するために、エージェント側の政策だけでなく、環境側も一緒に更新してしまおうという試みが紹介されている。 論文内の…

はてなブックマーク - Reinforcement Learning for Improving Agent Design :エンジニアが忘れてはいけないことを思い出させてくれた。
プロフィール
id:FakeOwl id:FakeOwl
読者です 読者をやめる 読者になる 読者になる
このブログについて
検索
リンク
  • はてなブログ
  • ブログをはじめる
  • 週刊はてなブログ
  • はてなブログPro
最新記事
  • 強化学習(TD3)を試したら環境依存性が強くてビックリしたという話
  • Exploration by Random Network Distillation の効果を MountainCar で試した。
  • 「対角化の計算はできるんだけど、何をやっているのかイマイチ腑に落ちていない」という方は読んでみて欲しい。
  • Reinforcement Learning for Improving Agent Design :エンジニアが忘れてはいけないことを思い出させてくれた。
  • EPISODIC CURIOSITY THROUGH REACHABILITY のメモ
月別アーカイブ
  • ▼ ▶
    2019
    • 2019 / 1
  • ▼ ▶
    2018
    • 2018 / 11
    • 2018 / 10
    • 2018 / 9
参加グループ
  • テクノロジー テクノロジー
FakeOwlのブログ FakeOwlのブログ

Powered by Hatena Blog | ブログを報告する

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる