
強化学習入門レシピ本を書きたい俺5
祝出版!! 涙の最終回
本記事にはアフィリエイト広告が含まれます。
HomeMadeGarbage Advent Calendar 2025 |11日目
前回はレシピ用のリアクションホイール倒立振子機体で強化学習Sim2Realまで確認しました。
本連載を通して容易に組める実機で倒立を強化学習という入門カリキュラムが構築できたのでレシピにまとめました。
連載最終回 それは喜びの出版報告となります。
入門レシピ出版
リアクションホイールで強化学習実践レシピ
~Sim.からRealまで網羅の完全版~
と題してこの度 見事に出版させていただきました。
↓購入先はコチラ です。
何卒宜しくお願い致します!!
内容
レシピの中身の概要です。
1. はじめに
2. リアクションホイール倒立振子
2-1. 部品
2-2. 組み立て手順
2-3. 手動倒立Arduinoコード
2-4. サンプルコード説明
2-5. アプリ動作
2-6. 倒立動作
強化学習入門レシピ本を書きたい俺
簡単な構成のリアクションホイール倒立振子 pic.twitter.com/WTdBRKhHal
— HomeMadeGarbage (@H0meMadeGarbage) December 1, 2025
3. MuJoCo
3-1. MuJoCo環境構築
3-2. リアクションホイール倒立振子 MuJoCoモデル
3-3. MuJoCoモデルで倒立動作確認
MuJoCoモデルの手動ゲイン調整 倒立動作 pic.twitter.com/VSDmIM783M
— HomeMadeGarbage (@H0meMadeGarbage) December 9, 2025
4. 強化学習
4-1. 強化学習環境構築
4-2. Gymnasium強化学習環境
4-3. Stable-Baselines3(PPO)学習スクリプト
4-4.強化学習実施
4-5.Sim2Sim
強化学習入門レシピ本を書きたい俺
倒立を強化学習
なかなかやるじゃない pic.twitter.com/VQZBqdXaAd— HomeMadeGarbage (@H0meMadeGarbage) December 6, 2025
5. Sim2Real
5-1.学習ポリシー移植
5-2.Sim2Real用Arduinoコード
5-3. アプリ動作
5-4. 倒立動作
強化学習入門レシピ本を書きたい俺
強化学習結果を実機で
つまり Sim2Real だわななかなかやるねぇ pic.twitter.com/xex3swVeLJ
— HomeMadeGarbage (@H0meMadeGarbage) December 6, 2025
6. あとがき
7. recipeData.zipデータ内容
8. 参考
9. 改訂履歴
おわりに
最後にレシピのあとがきを転載し本連載を閉じたいと思います。
本書では強化学習の入門本をめざしてリアクションホイール倒立振子をテーマとして強化学習シミュレーションから実機によるSim2Real動作確認までを紹介させていただきました。
MuJoCoモデルの精度向上や学習時のPPO設定や報酬設計など追い込むべき項目は山ほどあるのですが、本書ではドンドン手を動かして各項目を実行し大まかな強化学習の流れをつかんでいただくことを目的といたしました。
ブラシレスモータ1個のリアクションホイール倒立振子を強化学習して動かすことは はっきり言って非効率です。手動ゲイン調整で十分であることは本書冒頭で実施いただき実感してもらえたかと思います。しかし例えばリアクションホイールを3軸にして点倒立させ、さらに2重、3重と積み上げて安定倒立をさせるとなると考えるべきパラメータが増え手動での調整は難しくなります。そこで強化学習が有効になると考えられます。
実際、ここ数年のロボット動作の飛躍的な進化には、強化学習の発展が大きく寄与しています。従来の手作業による制御設計では難しかった複雑な動作が、ロボット自身がシミュレーション内で学習することで実現できるようになり性能が劇的に向上しました。
本書がきっかけとなり強化学習に興味をもち、面白いロボット開発の動機となっていただければ幸いです。個人的にはリアクションホイールへの興味も増していただけるとなお嬉しいです。
