科技日報2019年8月20日訊 據美國《連線(xiàn)》雜志網(wǎng)站近日報道,目前大部分人工智能研究都集中在個(gè)體智能體(Agent,指能自主活動(dòng)的軟件或者硬件實(shí)體)上,人工智能系統也一直是作為個(gè)體運作,但這些個(gè)體智能體不能組合成一個(gè)團隊來(lái)學(xué)習、工作,也不能相互協(xié)作完成相應的任務(wù)。麻省理工學(xué)院航空航天教授喬納森·豪認為,這種工作模式喪失了一個(gè)巨大的機會(huì ),未來(lái)機器人應該一起工作,互相學(xué)習。
在分布計算領(lǐng)域,人們通常把在分布式系統中持續自主發(fā)揮作用并具有自主性、交互性、反應性和主動(dòng)性的計算實(shí)體稱(chēng)為Agent。例如一輛單獨行駛在街道上的汽車(chē),一種能根據周?chē)h(huán)境變化而不斷調整的恒溫器。
豪領(lǐng)導的研究團隊一直致力于研究改變“移動(dòng)和人工智能設備相互協(xié)作和學(xué)習的方式”,希望通過(guò)人工智能的核心能力——機器學(xué)習,幫助智能對象,使彼此更智能。
豪認為,未來(lái)機器人可以互相學(xué)習,共同工作,從而改變物流(機器人完成訂單并送貨上門(mén))和太空探索(機器人合作探索新領(lǐng)域)等行業(yè)。而真正的挑戰是為這些人工智能機器人在實(shí)驗室之外的真實(shí)世界做好準備,這才是人工智能應該涉獵的領(lǐng)域。
機器人個(gè)體結成團隊工作
現實(shí)世界遠比人工智能機器人開(kāi)發(fā)實(shí)驗室環(huán)境復雜。在團隊工作中,人類(lèi)會(huì )思考,其他人在做什么?如何共同完成任務(wù)?這個(gè)任務(wù)會(huì )發(fā)生怎樣的變化?等等。而這些問(wèn)題,都將是機器人以團隊形式工作時(shí)所需要“考慮”的。
為了讓機器人以群體形式工作,豪帶領(lǐng)的團隊讓智能體在周邊環(huán)境中反復試驗,像人類(lèi)一樣學(xué)習。團隊利用他們自己開(kāi)發(fā)的新算法,以及機器人行業(yè)的經(jīng)驗,對其進(jìn)行了優(yōu)化,使用了一種名為強化學(xué)習的機器學(xué)習技術(shù),讓它們適應周邊環(huán)境。
團隊甚至更進(jìn)一步研究了“多智能體”參與時(shí)發(fā)生了什么?!岸嘀悄荏w”強化學(xué)習這門(mén)新興學(xué)科存在許多難題,包括:如何讓獨立的智能體在其他方面建立共識并達成一致?如何確保它們之間不斷的交談不會(huì )淹沒(méi)整個(gè)網(wǎng)絡(luò )?當一個(gè)有人工智能功能的機器人認為自己知道正確的做事方式,但它卻錯了時(shí)又會(huì )發(fā)生什么?
豪說(shuō):“如果我們對什么時(shí)候去吃晚飯都有不同的看法,你需要多少溝通才能達成一致?這看起來(lái)相對簡(jiǎn)單的問(wèn)題,但在機器人系統中,我們要處理的問(wèn)題非常多,通常這些問(wèn)題都有很多不確定性?!?/p>
只有出現了可行的深度學(xué)習平臺,才有可能真正回答這些問(wèn)題。豪和他的團隊使用由亞馬遜的EC2 GPU實(shí)例支持的AWS深度學(xué)習AMI環(huán)境,這些實(shí)例不需要管理機架和服務(wù)器,就可以在云上執行非常復雜的計算。他們的最終目標是訓練和運行強化學(xué)習模型的速度和準確性,以保證機器人足以應對現實(shí)世界中行為的影響。比如,當機器人意見(jiàn)不一致時(shí),它們之間不斷的嘮叨不會(huì )淹沒(méi)整個(gè)網(wǎng)絡(luò )。
復雜計算需要云平臺
在智能機器人共同學(xué)習的理想生態(tài)系統中,整體大于部分之和,這需要重大的技術(shù)努力才能實(shí)現。
在亞馬遜云服務(wù)(AWS)、波音和IBM聯(lián)合資助下,豪的團隊已經(jīng)進(jìn)行了一段時(shí)間的深入研究,通過(guò)足夠的計算能力運行復雜的強化學(xué)習算法,使一群機器人保持不斷的通信,并在聯(lián)機中調整它們的行為。新的強化學(xué)習系統被稱(chēng)為分層多智能體教學(xué),通過(guò)優(yōu)化獎勵功能和更有效的溝通,成功地提高了機器人在團隊范圍內的學(xué)習和協(xié)作整合解決問(wèn)題的能力。利用基于云的服務(wù),團隊中的每個(gè)成員都可以根據自己的需要,訪(fǎng)問(wèn)盡可能多的計算能力。
“在這種基于模擬的訓練中,我們要測試數百種設置,速度是至關(guān)重要的?!焙澜淌诘拇T士研究生金東基(音譯)說(shuō),“機器學(xué)習直接轉化為我們在更短的時(shí)間內運行更多迭代的能力。AWS提供了強大的GPU實(shí)例,大大縮短了訓練時(shí)間,加快了我們的研究步伐?!?/p>
豪認為,這項研究商業(yè)化需要5—10年的時(shí)間,但這可能是未來(lái)人工智能應用的一個(gè)基本推動(dòng)者。他表示,合作、有彈性機器人的用途幾乎是無(wú)限的。