日本語タイトル#
ハードウェアに基づくゼロ先験知識アプローチの腱駆動四足ロボットの運動制御における生涯学習の実現
英文タイトル#
Hardware Implementation of a Zero-Prior-Knowledge Approach to Lifelong Learning in Kinematic Control of Tendon-Driven Quadrupeds
日本語摘要#
哺乳類のように、ロボットは自らの身体構造や周囲の環境についての知識が不完全な状態でも、迅速に自分の身体を制御し、環境と相互作用することを学ばなければなりません。また、両者の継続的な変化にも適応する必要があります。本研究では、生物にインスパイアされた学習アルゴリズム、一般から特定(G2P)を提案し、自社開発・製造した腱駆動四足ロボットシステムに適用しました。我々の四足ロボットは、最初の 5 分間の一般化運動バブリング段階を経て、特定の周期的運動を達成するために 15 回の最適化試験(各 20 秒間)を行います。このプロセスは、哺乳類に見られる探索 - 利用のパラダイムを模倣しています。各最適化において、ロボットは初期の「十分良い」解決策を段階的に改善します。我々の結果は概念実証として機能し、ハードウェアインザループシステムが数分で冗長性を持つ腱駆動四足ロボットの制御を学習し、機能的かつ適応的な非凸周期的運動を実現できることを示しています。ロボットの運動における自律制御を進めることで、我々のアプローチは新しい環境に動的に適応できるロボットの道を開き、持続的な適応性と性能を確保します。
英文摘要#
Like mammals, robots must rapidly learn to control their bodies and interact with their environment despite incomplete knowledge of their body structure and surroundings. They must also adapt to continuous changes in both. This work presents a bio-inspired learning algorithm, General-to-Particular (G2P), applied to a tendon-driven quadruped robotic system developed and fabricated in-house. Our quadruped robot undergoes an initial five-minute phase of generalized motor babbling, followed by 15 refinement trials (each lasting 20 seconds) to achieve specific cyclical movements. This process mirrors the exploration-exploitation paradigm observed in mammals. With each refinement, the robot progressively improves upon its initial "good enough" solution. Our results serve as a proof-of-concept, demonstrating the hardware-in-the-loop system's ability to learn the control of a tendon-driven quadruped with redundancies in just a few minutes to achieve functional and adaptive cyclical non-convex movements. By advancing autonomous control in robotic locomotion, our approach paves the way for robots capable of dynamically adjusting to new environments, ensuring sustained adaptability and performance.
文章ページ#
ハードウェアに基づくゼロ先験知識アプローチの腱駆動四足ロボットの運動制御における生涯学習の実現
PDF 获取#
抖音でスキャンしてさらに素晴らしいコンテンツを見る