2018-03-10から1日間の記事一覧

2018-03-10

深層強化学習アルゴリズムDDPGをしっかり理解する(2)

この記事は、 sykwer.hatenablog.jp これ↑の続きにあたるものです. Deterministic policy gradient theoremの導出だけ知りたい! という人以外は、最初の記事から読むことをおすすめします. 2) DPGアルゴリズム 2.1) DPGアルゴリズムを使っていくモチベーショ…

sykwer’s blog

力こそパワー

2018-03-10から1日間の記事一覧

深層強化学習アルゴリズムDDPGをしっかり理解する(2)