やってみた!

やってみた!

試したことを中心に、書評や興味のあること、思ったこととか

2020-01-25から1日間の記事一覧

PyBullet-HumanoidFlagrunHarderBulletEnv-v0(3)

今回はSoft Actor-Critic(SAC)について備忘録ということで解説します。以下の論文は初期のSACをさらに改良したものです。 1.深層強化学習の理解に必要な事項の整理 まずは、各記号、考え方の整理など。 行動価値関数が最大になる行動を出力する方策関数を学…