国产视频一区二区_逐際動(dòng)力雙足機器人P1在深圳塘朗山零樣本、無(wú)保護、全開(kāi)放完成測試_深圳新聞網(wǎng)

<strike id="1fxbd"><i id="1fxbd"><cite id="1fxbd"></cite></i></strike>

<strike id="1fxbd"></strike><span id="1fxbd"></span>

<span id="1fxbd"><dl id="1fxbd"><ruby id="1fxbd"></ruby></dl></span>

<strike id="1fxbd"></strike>

<ruby id="1fxbd"><ins id="1fxbd"></ins></ruby>

<span id="1fxbd"><i id="1fxbd"></i></span>

逐際動(dòng)力雙足機器人P1在深圳塘朗山零樣本、無(wú)保護、全開(kāi)放完成測試

2024-03-12 11:24

來(lái)源：深圳新聞網(wǎng)

人工智能朗讀：

逐際動(dòng)力雙足機器人P1在深圳塘朗山零樣本、無(wú)保護、全開(kāi)放完成測試

分享

深圳新聞網(wǎng)2024年3月12日訊（記者葉梅）3月12日，基于強化學(xué)習（Reinforcement Learning，RL），“逐際動(dòng)力雙足機器人P1”第一次來(lái)到位于深圳的郊野公園塘朗山，零樣本、無(wú)保護、全開(kāi)放進(jìn)行測試，開(kāi)箱即跑，在完全陌生的野外環(huán)境中，高動(dòng)態(tài)完成了在多種復雜地形上的移動(dòng)，表現出強化學(xué)習訓練后，優(yōu)異的控制力和穩定性。

逐際動(dòng)力雙足機器人P1基于強化學(xué)習完成野外森林徒步測試

逐際動(dòng)力在強化學(xué)習有著(zhù)長(cháng)期的積累，目前聚焦把強化學(xué)習的前沿技術(shù)轉化為系統化研發(fā)能力，支持產(chǎn)品功能開(kāi)發(fā)，并提出了自己的強化學(xué)習研發(fā)體系，主要包括Real2Sim2Real閉環(huán)、神經(jīng)網(wǎng)絡(luò )架構設計、數據生成機制與訓練算法設計等三大核心版塊，搭配不斷完善的流程管理和算法驗證，推動(dòng)人形機器人重要功能的開(kāi)發(fā)。

逐際動(dòng)力雙足機器人P1在狹窄的溝渠中高動(dòng)態(tài)穩定行走

P1是逐際動(dòng)力在中國率先推出的一款新穎的雙足機器人，也是逐際動(dòng)力強化學(xué)習系統化研發(fā)與模塊化測試的重要平臺，用于推進(jìn)雙足基礎運動(dòng)能力的研發(fā)和迭代。P1成功征服野外森林，正是逐際動(dòng)力強化學(xué)習系統化研發(fā)的成果，也是三大核心板塊能力的體現。

逐際動(dòng)力雙足機器人P1在猛烈擊打下表現出強大的抗干擾能力

Real2Sim2Real閉環(huán)，從Real2Sim到Sim2Real，打通數據到數據的自動(dòng)閉環(huán)，不管是采集物理世界數據生成仿真模型，還是把仿真后的策略部署到硬件上，從數據的生成、遷移到部署，逐際動(dòng)力的目標是實(shí)現全過(guò)程自動(dòng)化，最大限度降低人工干預，縮小仿真和現實(shí)之間的差距，提高訓練的效率和質(zhì)量。

神經(jīng)網(wǎng)絡(luò )架構設計，神經(jīng)網(wǎng)絡(luò )并不是一個(gè)黑盒，而是一個(gè)科學(xué)的系統化復雜結構，決定了強化學(xué)習能力的上限，其架構的設計體現了不同團隊的特點(diǎn)和實(shí)力。逐際動(dòng)力的神經(jīng)網(wǎng)絡(luò )由不同模塊組成，如何劃分模塊、如何定義每個(gè)模塊、每個(gè)模塊輸入輸出的界面是什么，這些設計至關(guān)重要。逐際動(dòng)力打造的神經(jīng)網(wǎng)絡(luò )架構能夠有效應對環(huán)境交互和硬件差異帶來(lái)的巨大干擾，生成具有自適應性的控制策略，實(shí)現同一個(gè)神經(jīng)網(wǎng)絡(luò )適用于不同的機器人和場(chǎng)景。

數據生成機制與訓練算法設計，在強化學(xué)習中，數據是訓練的關(guān)鍵，但不是數據規模越大，訓練效果就一定越好。逐際動(dòng)力把重點(diǎn)鎖定在解決有效數據稀缺的問(wèn)題上，提出迭代式預訓練（Iterative Pre-training）方法，把通用機器人的基礎運動(dòng)能力劃分為不同級別，進(jìn)行循序漸進(jìn)的預訓練，這個(gè)過(guò)程讓訓練的結果更可控，從而高效地產(chǎn)出和收集有效數據，訓練出高性能的策略（Policy）。

雙足機器人P1是逐際動(dòng)力強化學(xué)習系統化研發(fā)與模塊化測試的重要平臺

在這次測試中，我們看到野外和實(shí)驗室、城市的最大區別是，沒(méi)有一個(gè)臺階或者斜坡，甚至平地是一樣的；從山腳到山頂，沿途的地貌截然不同，水土流失導致地下巖石裸露，斜坡上長(cháng)滿(mǎn)纏繞的藤蔓，土層風(fēng)化變成泥沙覆蓋地面，就地取材搭成的溝渠奇形怪狀，這些都是P1從未經(jīng)歷過(guò)的場(chǎng)景，對于普通人來(lái)說(shuō)也不是輕而易舉就能克服。

在仿真訓練過(guò)程中，P1沒(méi)有被輸入過(guò)任何與森林、徒步相關(guān)的數據，與落地環(huán)境差異巨大，但依然能夠適應全新的環(huán)境，在變化莫測的森林中自如行走。這得益于逐際動(dòng)力系統化的強化學(xué)習訓練，保證研發(fā)成果在實(shí)際應用中可行、可用、可靠。

逐際動(dòng)力雙足機器人P1在野外森林進(jìn)行零樣本、無(wú)保護、全開(kāi)放測試

具身智能研發(fā)的四大要素包括硬件、算法、數據、算力，強化學(xué)習是算法中至關(guān)重要的技術(shù)棧，逐際動(dòng)力強調系統化的研發(fā)流程和能力， P1成為中國首個(gè)成功在野外徒步的雙足機器人，證明了這個(gè)技術(shù)路徑的先進(jìn)性。除了移動(dòng)控制（Locomotion），在操作（Manipulation）和移動(dòng)操作（Loco-manipulation）方面，逐際動(dòng)力在人形機器人上也在不斷攻關(guān)，接下來(lái)將有更多新的進(jìn)展和大家分享。

逐際動(dòng)力系統化的強化學(xué)習訓練，保證研發(fā)成果在實(shí)際應用中可行、可用、可靠

（圖片來(lái)源：逐際動(dòng)力）

[編輯：田晨夕馬丹] [責任編輯：熊三有]

国产精品香港三级国产AV|JULIA手机在线观看精品|亚洲乱色熟女一区二区三区麻豆|欧美牲交a欧美牲交久久精品|亚洲成A∧人片在线播放无码

<strike id="1fxbd"><i id="1fxbd"><cite id="1fxbd"></cite></i></strike>

<strike id="1fxbd"></strike><span id="1fxbd"></span>

<span id="1fxbd"><dl id="1fxbd"><ruby id="1fxbd"></ruby></dl></span>

<strike id="1fxbd"></strike>

<ruby id="1fxbd"><ins id="1fxbd"></ins></ruby>

<span id="1fxbd"><i id="1fxbd"></i></span>