但这些个体智能体不能组合成一个团队来学习、工作-平凉新闻网
点击关闭

时间实例-但这些个体智能体不能组合成一个团队来学习、工作-平凉新闻网

  • 时间:

特朗普会见扎克伯格

豪領導的研究團隊一直致力於研究改變「移動和人工智能設備相互協作和學習的方式」,希望通過人工智能的核心能力——機器學習,幫助智能對象,使彼此更智能。

今日視點據美國《連線》雜誌網站近日報道,目前大部分人工智能研究都集中在個體智能體(Agent,指能自主活動的軟件或者硬件實體)上,人工智能系統也一直是作為個體運作,但這些個體智能體不能組合成一個團隊來學習、工作,也不能相互協作完成相應的任務。麻省理工學院航空航天教授喬納森·豪認為,這種工作模式喪失了一個巨大的機會,未來機械人應該一起工作,互相學習。

複雜計算需要雲平台在智能機械人共同學習的理想生態系統中,整體大於部分之和,這需要重大的技術努力才能實現。

在亞馬遜雲服務(AWS)、波音和IBM聯合資助下,豪的團隊已經進行了一段時間的深入研究,通過足夠的計算能力運行複雜的強化學習算法,使一群機械人保持不斷的通信,並在聯機中調整它們的行為。新的強化學習系統被稱為分層多智能體教學,通過優化獎勵功能和更有效的溝通,成功地提高了機械人在團隊範圍內的學習和協作整合解決問題的能力。利用基於雲的服務,團隊中的每個成員都可以根據自己的需要,訪問儘可能多的計算能力。

(科技日報北京8月19日電)

分佈式智能體(Agent)具有自主性、交互性、反應性和主動性。

為了讓機械人以群體形式工作,豪帶領的團隊讓智能體在周邊環境中反覆試驗,像人類一樣學習。團隊利用他們自己開發的新算法,以及機械人行業的經驗,對其進行了優化,使用了一種名為強化學習的機器學習技術,讓它們適應周邊環境。

「在這種基於模擬的訓練中,我們要測試數百種設置,速度是至關重要的。」豪教授的碩士研究生金東基(音譯)說,「機器學習直接轉化為我們在更短的時間內運行更多迭代的能力。AWS提供了強大的GPU實例,大大縮短了訓練時間,加快了我們的研究步伐。」

機械人個體結成團隊工作現實世界遠比人工智能機械人開發實驗室環境複雜。在團隊工作中,人類會思考,其他人在做什麼?如何共同完成任務?這個任務會發生怎樣的變化?等等。而這些問題,都將是機械人以團隊形式工作時所需要「考慮」的。

在分佈計算領域,人們通常把在分佈式系統中持續自主發揮作用並具有自主性、交互性、反應性和主動性的計算實體稱為Agent。例如一輛單獨行駛在街道上的汽車,一種能根據周圍環境變化而不斷調整的恆溫器。

團隊甚至更進一步研究了「多智能體」參与時發生了什麼。「多智能體」強化學習這門新興學科存在許多難題,包括:如何讓獨立的智能體在其他方面建立共識並達成一致?如何確保它們之間不斷的交談不會淹沒整個網絡?當一個有人工智能功能的機械人認為自己知道正確的做事方式,但它卻錯了時又會發生什麼?

图片来自网络

豪認為,未來機械人可以互相學習,共同工作,從而改變物流(機械人完成訂單並送貨上門)和太空探索(機械人合作探索新領域)等行業。而真正的挑戰是為這些人工智能機械人在實驗室之外的真實世界做好準備,這才是人工智能應該涉獵的領域。

通過「強化學習」,讓每個智能體適應周圍環境和群體協作。未來的分佈式機械人可以互相學習,一起工作,共同完成複雜任務。

豪認為,這項研究商業化需要5—10年的時間,但這可能是未來人工智能應用的一個基本推動者。他表示,合作、有彈性機械人的用途幾乎是無限的。

豪說:「如果我們對什麼時候去吃晚飯都有不同的看法,你需要多少溝通才能達成一致?這看起來相對簡單的問題,但在機械人系統中,我們要處理的問題非常多,通常這些問題都有很多不確定性。」

只有出現了可行的深度學習平台,才有可能真正回答這些問題。豪和他的團隊使用由亞馬遜的EC2GPU實例支持的AWS深度學習AMI環境,這些實例不需要管理機架和服務器,就可以在雲上執行非常複雜的計算。他們的最終目標是訓練和運行強化學習模型的速度和準確性,以保證機械人足以應對現實世界中行為的影響。比如,當機械人意見不一致時,它們之間不斷的嘮叨不會淹沒整個網絡。

今日关键词:国航客机引擎起火