
2足歩行ロボット HM-02 の強化学習
前回は2足歩行ロボット HM-01 の足踏みバランス動作を目指して強化学習を実施しました。
足踏み動作をリファレンスモーションとして用意して外乱を与えてバランス学習しました。
それはそれは見事なSim2Realで強化学習の有用性を実感するとともに、手前味噌ですがシミュレーション用のモータモデルそしてロボットモデルが非常に良い精度で用意できたなと満足を得ました。
目次
HM-02 強化学習
2足歩行ロボット HM-01 の強化学習が好感触だったので以前製作したシリアルリンクロボ (HM-02)のモデルでも同様に学習してみました。
ダイナミックに動けるロボのほうが学習面白いなぁ
シリアルリンクロボに戻りますかぁ#強化学習 #ReinforcementLearning pic.twitter.com/e7f0ODftY5— HomeMadeGarbage (@H0meMadeGarbage) October 15, 2025
シリアルリンクでダイナミックに足を動かせる分、足踏みがアニメのようでカワイくなりました。
これ本当に実機でも再現されるんか?
というわけで実機を用意してSim2Realしてみます。
機体修正
以前つくったシリアルリンクロボを強化学習したモデル時に近づくよう改修します。
かかとの機構を廃止します。
真心をこめて改修・製作
改修完了
一旦この機体で強化学習いきますかぁ pic.twitter.com/3bCQ1W0XPQ
— HomeMadeGarbage (@H0meMadeGarbage) October 20, 2025
ニューラルネットワーク移植
冒頭の強化学習結果のニューラルネットワークを改修したロボに移行します。
移植したネットワークでまずは股関節のみ動作させて味見
ひとまず股関節のみでニューラルネットワークを味見
なかなかいいじゃない#PhysicalAI https://t.co/uRo44H0SXJ pic.twitter.com/1gPKBcW475
— HomeMadeGarbage (@H0meMadeGarbage) October 21, 2025
いい感じ♪
全足 駆動
前進ニューラル駆動
Sim2Real 移行はできたかな
さてほんとに足踏みできるかな#PhysicalAI pic.twitter.com/OPVc8hN5s7— HomeMadeGarbage (@H0meMadeGarbage) October 21, 2025
見事に足踏みできてます。
ロボのCANシステムは以下の通り
各足のドライバにCANでモータ角度指定&エンコーダによる回転角度を中枢マイコンにCAN送信
学習結果のニューラルネットワークの構成は以下の通り
観測ベクトル(obs)14次元
・ピッチ角、ロール角 [rad]
・ピッチ角速度、ロール角速度 [rad/s]
・左足4軸の各モータの回転位置角度 [rad]
・右足4軸の各モータの回転位置角度 [rad]
・ sin(θ)
・ cos(θ)
※ θ = (2π ÷ 0.45秒) × time
時間経過による周期フェーズをsin・cosに変換して入力することで、
0と2πの不連続を避けて学習を安定化させています。
行動ベクトル(action)8次元
・左足4軸の各モータの回転位置角度 [rad]
・右足4軸の各モータの回転位置角度 [rad]
各要素 -1.0 ~ +1.0 で正規化されて出力される
学習時は50°をかけてスケーリング
Sim2Real
足踏み動作を確認
あ 全然だめだ。。
モータ戻すかぁ pic.twitter.com/IRGMUo0T8i— HomeMadeGarbage (@H0meMadeGarbage) October 21, 2025
全然だめだ。。
機体修正2
実機のモータはコレ↓で
強化学習モデルのモータは 5010 360KV ↓なので
足モータをすべて 5010 360KV に戻します。
Sim2Real
モータ交換が完了したのでSim2Real実施
あー全然だめだ https://t.co/uRo44H0SXJ pic.twitter.com/Egn5z4Vpg5
— HomeMadeGarbage (@H0meMadeGarbage) October 22, 2025
同様に全然ダメでした。。。
モータの違いが大きな要因ではないようです。
バッテリ搭載
学習モデルにはバッテリが搭載されていません。
ダイナミックに動けるロボのほうが学習面白いなぁ
シリアルリンクロボに戻りますかぁ#強化学習 #ReinforcementLearning pic.twitter.com/e7f0ODftY5— HomeMadeGarbage (@H0meMadeGarbage) October 15, 2025
これが実機でうまくいかない理由ですね。
ということでバッテリ搭載モデルを用意
重量も実機に合わせています。
強化学習
バッテリ込みのモデルで同様に足踏みバランス動作を学習させましたが。。
バッテリ重いんだなぁ
Sim.でもキツそうだわ#MuJoCo #強化学習#ReinforcementLearning pic.twitter.com/3Q5aHWby7c— HomeMadeGarbage (@H0meMadeGarbage) October 23, 2025
いろいろ試しましたがバッテリが重いため安定できませんでした。
実機の通りですね。
モータトルクが足りないようです。。(´;ω;`)
バッテリ搭載廃止
バッテリ搭載なしで動作確認します。
配線を延長して外部から給電します。
バッテリ搭載なしだと冒頭の強化学習結果のように足踏み動作ができました。
モータのトルクが足りずバッテリ搭載がキツいということが
SimでもRealでも立証されたあとモータやロボのモデルの出来の良さも確認できた https://t.co/uRo44H0l8b pic.twitter.com/Ferxecz0C3
— HomeMadeGarbage (@H0meMadeGarbage) October 24, 2025
いろいろとやってきましたが結論としては、
本ロボのモータ機構ではトルクが足りず バッテリ搭載でのバランス足踏み動作は難しいということがSim.でもRealでも証明された
ということになります。
おわりに
ここではシリアルリンク機構の2足歩行ロボット HM-02 の強化学習によるSim2Realを検証しました。
結果的には良い結果を得ることはできなかったのですが、Sim. とRealの乖離はなく、ロボのMuJoCoモデルの精度は高いことは証明されました。
MuJoCoによる物理シミュレーションは有用で今後も設計や強化学習に使える自信となりました。
あとはやはり十分なトルクのモータや高出力のドライバが欲しいなぁという感想です。








