sykwer’s blog

力こそパワー

C++版ROS2のメッセージ型構造体にカスタムメモリアロケータを指定したい

この記事は, ROS2 Advent Calendar 2022 の12月16日分の記事です. 2022年12月16日時点のROS2エコシステムの現状を元に書いた記事ですので, 近い将来事情が変わっているかもしれません. qiita.com こんにちは, @sykwer です. 普段は自動運転システムに特化し…

[組み込みOS - kozos] スイッチを押してからOSがコマンド応答するまでを追う

これは 自作OS Advent Calendar 2018 - Adventar 23日目の記事です 0. はじめに @kozossakai さんが開発された kozos という, H8/3069Fの上で動く組み込みOSをベースにして, 色々改造した内容をアドベントカレンダー向けに書きたかったのですが, 時間がとれ…

深層強化学習アルゴリズムDDPGをしっかり理解する(3)

DDPGは、行動空間が連続である制御タスクを学習させる際に、選択肢に挙がる深層強化学習アルゴリズムの一つです. アルゴリズムの幹となっているDeterministicPolicyGradientTheoremをしっかり理解するには、関連する論文を順に読んでいかなくてはならず、理…

深層強化学習アルゴリズムDDPGをしっかり理解する(2)

この記事は、 sykwer.hatenablog.jp これ↑の続きにあたるものです. Deterministic policy gradient theoremの導出だけ知りたい! という人以外は、最初の記事から読むことをおすすめします. 2) DPGアルゴリズム 2.1) DPGアルゴリズムを使っていくモチベーショ…

深層強化学習アルゴリズムDDPGをしっかり理解する(1)

強化学習において、方策を最適化するアルゴリズムを大きく2つに分類すると、「価値反復に基づくアルゴリズム」と「方策勾配に基づくアルゴリズム」に分けられます. 前者は、状態価値関数V(s)や行動価値関数Q(s, a)にもとづいて方策を記述し、V(s)やQ(s, a)の…

Hello Hatena Blog

@sykwerです. 人生初ブログです. 次の春で大学3年生になります. 無事に進級ができていれば東京大学の工学部に進めます. ソフトウェアエンジニアです. このブログでは、ソフトウェアエンジニアリングに関連することを中心に書いていきたいと思っています. 4月…