[組み込みOS - kozos] スイッチを押してからOSがコマンド応答するまでを追う

組み込みOS - kozos

これは自作OS Advent Calendar 2018 - Adventar 23日目の記事です 0. はじめに @kozossakai さんが開発された kozos という, H8/3069Fの上で動く組み込みOSをベースにして, 色々改造した内容をアドベントカレンダー向けに書きたかったのですが, 時間がとれ…

2018-04-19

深層強化学習アルゴリズムDDPGをしっかり理解する(3)

DDPGは、行動空間が連続である制御タスクを学習させる際に、選択肢に挙がる深層強化学習アルゴリズムの一つです. アルゴリズムの幹となっているDeterministicPolicyGradientTheoremをしっかり理解するには、関連する論文を順に読んでいかなくてはならず、理…

2018-03-10

深層強化学習アルゴリズムDDPGをしっかり理解する(2)

この記事は、 sykwer.hatenablog.jp これ↑の続きにあたるものです. Deterministic policy gradient theoremの導出だけ知りたい! という人以外は、最初の記事から読むことをおすすめします. 2) DPGアルゴリズム 2.1) DPGアルゴリズムを使っていくモチベーショ…