
PPO
AIエージェント Codex で 強化学習3 起き上がり4脚ロボット
前回はAIエージェント Codex で簡素な2軸の起き上がりロボの強化学習を実施いたしました。 https://homemadegarbage.com/rl13// 簡単なPWMサーボでも強化学習によって見事な起き上がりロボになりました。 フィジカルAIって、心を鬼にしないといけない...
AIエージェント Codex で 強化学習2 起き上がりロボ
前回はAIエージェント Codexに強化学習を実施してもらい2足歩行ロボットのバランス動作を実現しました。 https://homemadegarbage.com/rl12// Codex先生が学習の環境構築、報酬設計、学習フローすべて考えてくださり、長年憧れていた動作ができました。 C...
AIエージェント Codex で 強化学習2足歩行ロボット HM-01
最近はAIエージェント Codexをさわって色々楽しませていただいております。 今回はCodexで強化学習を楽しみましたので報告いたします。 テーマとして2足歩行ロボットのバランス動作を選択しました。 これまた生活変わるレベルで驚かされました。 2足歩行ロボットの強化学習...
2足歩行ロボット HM-01 の強化学習3
以前実施した自作2足歩行ロボ HM-01の強化学習について改めて考えてみました。 https://homemadegarbage.com/rl09/ ロボットの強化学習による動作生成は今や当たり前のように実用され、フレームワークも進化し整ってきているように感じます。 GPU...
2足歩行ロボット HM-02 の強化学習
前回は2足歩行ロボット HM-01 の足踏みバランス動作を目指して強化学習を実施しました。 https://homemadegarbage.com/rl09/ 足踏み動作をリファレンスモーションとして用意して外乱を与えてバランス学習しました。 それはそれは見事なSim2Realで強化学習の有用...
2足歩行ロボット HM-01 の強化学習2
2足歩行ロボット HM-01 の足踏みバランス動作を目指して強化学習の実施を決意いたしました。 前回は強化学習の計算時間短縮をめざしてGPU活用とCPU並列化の検討しました。 https://homemadegarbage.com/rl08/ 強化学習からSim2Sim~Sim2Real 実現...
2足歩行ロボット HM-01 の強化学習1
先日 公開した 2足歩行ロボット HM-01 のMJCFファイルを用いて機械学習を実施しましたので報告いたします。 公開 MJCFモデル詳細はコチラ↓ https://homemadegarbage.com/bldcrobo07/ ロボットの強化学習については以前シリアルリンク...
強化学習への道7 -ロボット強化学習3-
前回はロボ関節をギアを含めたアクチュエータとしてモデリングして、角度指定による2足歩行ロボットモデルを完成させました。 https://homemadegarbage.com/rl06 ここではこのモデルでロボット動作の強化学習を実施たいと思います。 バランス強...
強化学習への道6 -ロボット強化学習2-
前回は2足歩行ロボットの強化学習に挑戦し、うまくいかないのでモータ単体のモデルを再検証検証しました。 https://homemadegarbage.com/rl05// トルク駆動のブラシレスモータモデルでモータ単体の角度変更 強化学習 Sim2Real実証を行いました。 ...
強化学習への道5 -ロボット強化学習1-
前回はブラシレスモータ2足歩行ロボットの強化学習シミュレーション用MuJoCoモデルを制作しました。 https://homemadegarbage.com/rl04// ここではこのモデルで遂に2足歩行ロボットの強化学習に挑戦します。 ロボット直立 強化学習 ...
強化学習への道4 -ロボットSimモデル作成-
前回はブラシレスモータによるリアクションホイール姿勢制御モジュールの強化学習結果を実機に移行してSim2Realを楽しみました。 https://homemadegarbage.com/rl03/ 実機でも倒立動作を確認することができ強化学習の有用性を体感することができました。 ここでは同じブ...
強化学習への道3 -Sim2Real-
前回はついに強化学習に挑戦しました。 https://homemadegarbage.com/rl02// リアクションホイール姿勢制御モジュールの倒立動作を学習しシミュレーション上で実現させました。 外乱にも耐えうる学習結果を得られるようになった。 一旦これでSim...
強化学習への道2 -強化学習開始-
前回は強化学習に出会い勉強することを決意いたしました。 https://homemadegarbage.com/rl01/ まずは物理シミュレーションエンジンMoJuCoの環境を整え使い方を学びました。 強化学習の初手のテーマとしてブラシレスモータによるリアクションホイール1軸...