やってみた!

やってみた!

試したことを中心に、書評や興味のあること、思ったこととか

2020-01-01から1ヶ月間の記事一覧

Colabortoryをローカルランタイムで使ってみる

2020年1月30日 改訂1 エラーが表示されjupyterがうまく実行されず、ipykernelをアップグレードした件について、最後に追記しました。 ------------------------------------- Google Colaboratoryは大変便利なのですが…

PyBullet-HumanoidFlagrunHarderBulletEnv-v0(3)

今回はSoft Actor-Critic(SAC)について備忘録ということで解説します。以下の論文は初期のSACをさらに改良したものです。 1.深層強化学習の理解に必要な事項の整理 まずは、各記号、考え方の整理など。 行動価値関数が最大になる行動を出力する方策関数を学…

PyBullet-HumanoidFlagrunHarderBulletEnv-v0(2)

2020/1/25改正 学習継続時に早くalphaが収束するようalpha、log_alpha、alpha_optimizerを保存するように変更しました。gpu有、無しの両環境で保存データを共有できるようモデル読み込み時にmap_location=deviceを追加しました。 2020/1/23改正 BATCH_SIZEを…

PyBullet-HumanoidFlagrunHarderBulletEnv-v0(1)

次は3Dの物理シミュレータを使ってみます。以前はOpen AI Gymで使える3D物理環境は有料のMuJoCo用だけでしたが、今では無料で使えるPyBullet用環境(env)もあるということなので、こちらを使ってみます。 PyBulletはErwin Cumansさんらが開発したオープンソー…