強化学習入門レシピ本を書きたい俺5
祝出版!! 涙の最終回

Home > Advent Calendar > 強化学習入門レシピ本を書きたい俺5 祝出版!! 涙の最終回

本記事にはアフィリエイト広告が含まれます。

すき 0
うんこ 0

HomeMadeGarbage Advent Calendar 2025 |11日目

前回はレシピ用のリアクションホイール倒立振子機体で強化学習Sim2Realまで確認しました。

強化学習入門レシピ本を書きたい俺4

本連載を通して容易に組める実機で倒立を強化学習という入門カリキュラムが構築できたのでレシピにまとめました。

連載最終回 それは喜びの出版報告となります。

 

AudiostockでBGM・効果音を販売中!

入門レシピ出版

リアクションホイールで強化学習実践レシピ
 ~Sim.からRealまで網羅の完全版~

と題してこの度 見事に出版させていただきました。

↓購入先はコチラ です。

[電子工作レシピ] リアクションホイールで強化学習実践レシピ

何卒宜しくお願い致します!!

内容

レシピの中身の概要です。

1. はじめに 
2. リアクションホイール倒立振子
 2-1. 部品
 2-2. 組み立て手順
 2-3. 手動倒立Arduinoコード
 2-4. サンプルコード説明
 2-5. アプリ動作
 2-6. 倒立動作

3. MuJoCo
 3-1. MuJoCo環境構築
 3-2. リアクションホイール倒立振子 MuJoCoモデル
 3-3. MuJoCoモデルで倒立動作確認

4. 強化学習
 4-1. 強化学習環境構築
 4-2. Gymnasium強化学習環境
 4-3. Stable-Baselines3(PPO)学習スクリプト
 4-4.強化学習実施
 4-5.Sim2Sim

5. Sim2Real
 5-1.学習ポリシー移植
 5-2.Sim2Real用Arduinoコード
 5-3. アプリ動作
 5-4. 倒立動作

6. あとがき
7. recipeData.zipデータ内容
8. 参考
9. 改訂履歴

 

おわりに

最後にレシピのあとがきを転載し本連載を閉じたいと思います。
 

 本書では強化学習の入門本をめざしてリアクションホイール倒立振子をテーマとして強化学習シミュレーションから実機によるSim2Real動作確認までを紹介させていただきました。

 MuJoCoモデルの精度向上や学習時のPPO設定や報酬設計など追い込むべき項目は山ほどあるのですが、本書ではドンドン手を動かして各項目を実行し大まかな強化学習の流れをつかんでいただくことを目的といたしました。

 ブラシレスモータ1個のリアクションホイール倒立振子を強化学習して動かすことは はっきり言って非効率です。手動ゲイン調整で十分であることは本書冒頭で実施いただき実感してもらえたかと思います。しかし例えばリアクションホイールを3軸にして点倒立させ、さらに2重、3重と積み上げて安定倒立をさせるとなると考えるべきパラメータが増え手動での調整は難しくなります。そこで強化学習が有効になると考えられます。

 実際、ここ数年のロボット動作の飛躍的な進化には、強化学習の発展が大きく寄与しています。従来の手作業による制御設計では難しかった複雑な動作が、ロボット自身がシミュレーション内で学習することで実現できるようになり性能が劇的に向上しました。

 本書がきっかけとなり強化学習に興味をもち、面白いロボット開発の動機となっていただければ幸いです。個人的にはリアクションホイールへの興味も増していただけるとなお嬉しいです。

 

コメントはこちらから

メールアドレスが公開されることはありません。コメントのみでもOKです。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください