(圖自:MPI-IS / Dynamic Locomotion Group / Felix Ruppert)
(相關(guān)資料圖)
在大自然中,新生的小鹿或小馬駒必須盡快學(xué)會行走,以躲避掠食者。即使動物天生就有位于脊髓中的肌肉協(xié)調(diào)網(wǎng)絡(luò),但學(xué)習(xí)腿部肌肉和肌腱的精確協(xié)調(diào),還是需要一些時間的。
起初,嬰兒動物主要依賴于硬連接的脊髓反射。雖然更加底層,但運動控制反射有助于其在第一次嘗試行走時避免跌倒和傷害自己。
通過一段時間的練習(xí),它們才會掌握更高級和更精確的肌肉控制,直到神經(jīng)系統(tǒng)最終能夠很好地適應(yīng)年輕動物的腿部肌肉和肌腱。在越過了失控的障礙后,它們就可以跟上成年動物了。
研究配圖 - 1:四足機器人 Morti
MPI-IS 動態(tài)運動研究小組的前博士生 Felix Ruppert 表示:
作為一名工程師和機器人專家,其正在通過構(gòu)建一個像動物一樣具備反射能力、并從錯誤中習(xí)得經(jīng)驗的機器人。
若動物只是偶爾絆倒,這個錯誤還不好說。但若它經(jīng)常絆倒,就可以拿來衡量機器人行走的質(zhì)量好壞了。
研究配圖 - 2:彈性可塑框架示意圖
值得一提的是,在僅僅一小時的走路學(xué)習(xí)后,機器狗 Morti 就已充分掌握其復(fù)雜的腿部力學(xué)。
在貝葉斯優(yōu)化的指導(dǎo)學(xué)習(xí)下,足部傳感器測得的信息,可與程序建模的虛擬脊髓目標(biāo)數(shù)據(jù)相匹配。
通過不斷比較發(fā)送和預(yù)期的傳感器信息,機器狗得以找到循環(huán)反饋的改進,調(diào)整其電機控制模式來學(xué)習(xí)行走。
研究配圖 - 3:模擬與實踐試錯的對比參照
學(xué)習(xí)算法能夠適應(yīng)中央模式生成器(CPG)的控制參數(shù),在人類和動物中,CPG 就是脊髓中的神經(jīng)元網(wǎng)絡(luò)。
它能夠在不依賴大腦輸入的情況下,產(chǎn)生周期性的肌肉收縮,可在步行、眨眼或消化等有節(jié)奏的任務(wù)中提供幫助。
至于反射,則由腿部傳感器和硬編碼的神經(jīng)通路,來觸發(fā)非自愿運動的控制動作。
研究配圖 - 4:CPG 參數(shù)與彈性反饋活動
只要幼小動物在完全平坦的路面上行走,CPG 就足以控制來自脊髓的運動信號。但只要地面上有個小顛簸,其步行方式就會發(fā)生改變。
為避免跌倒,反射會介入并調(diào)節(jié)運動模式。而運動信號的這些瞬時變化,又是可逆或“彈性的”。即使受到干擾,后續(xù)也能夠恢復(fù)如初。
但若動物在多次運動循環(huán)中不停地跌跌撞撞 —— 即使反應(yīng)活躍 —— 那也必須通過重新學(xué)習(xí)運動模式、并使其具有不可逆轉(zhuǎn)的“可塑性”。
研究配圖 - 5:塑性適應(yīng)的結(jié)果
新生動物最初的 CPG 調(diào)節(jié)還不夠號,導(dǎo)致其在平坦或不平坦的地形上蹣跚而行,本文介紹的機器狗 Morti 也是如此。
更重要的是,在大約一小時內(nèi),機器狗已能夠做到比小動物更快地優(yōu)化其運動模式 —— 這得益于 Morti 的 CPG 在控制機器腿部運動的小型輕量計算機上進行了模擬。
這個虛擬脊髓被放置在了四足機器狗的頭背部位置,在平穩(wěn)行走的一小時內(nèi),來自其足部的傳感器數(shù)據(jù)能夠與 CPG 的預(yù)測效果不斷進行比較。
研究配圖 - 6:扭矩性能的標(biāo)準(zhǔn)化測量
若機器人絆倒,學(xué)習(xí)算法會改變其腿的來回擺動距離、擺動速度、以及落地行程。同時調(diào)節(jié)后的運動,也會影響機器人靈活運用其腳力的能力。
在學(xué)習(xí)過程中,CPG 會向電機發(fā)送經(jīng)過調(diào)整的信號,以便機器狗從此減少磕絆并優(yōu)化其行走。
但是在這一框架中,虛擬脊髓并沒有對機器人的腿部動作設(shè)計、電機和彈簧的物理特征有明確的了解。
(來自:Nature Machine Intelligence)
Flix Ruppert 解釋稱:這臺機器狗實際上有些“天生”的特性,即使對自己的腿部解剖結(jié)構(gòu)或工作原理一無所知,內(nèi)置 CPG 還是可以自然且智能地幫助其行走。
計算機產(chǎn)生了控制腿部電機的信號,起初有些跌跌撞撞。但從傳感器不斷回流的數(shù)據(jù),還是可以通過與虛擬脊髓 CPG 產(chǎn)生的進行比較。
若傳感器數(shù)據(jù)與預(yù)期結(jié)果不匹配,則學(xué)習(xí)算法會讓它改變行走行為,直到機器人能夠在不被絆倒的情況下良好行走。
綜上所述,在保持反射活躍的情況下改變 CPG 輸出、并監(jiān)測機器狗絆倒的學(xué)習(xí)過程,就是其中最核心的部分。
更棒的是,Morti 的板載電腦,只會在行走過程中消耗 5 瓦的電力。
最后,盡管來自某些知名制造商的工業(yè)四足機器人已學(xué)會在復(fù)雜的控制器的幫助下運行,但它們的功耗也要大得多。
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-19
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18
頭條 22-07-18