
【獵云網(wǎng)(微信號:ilieyun)】5月26日報道(編譯:蔡妙嫻)
編者注:本文作者Will Knight是MIT Technology Review中AI版塊的高級主編,他向我們分享了人工智能和好奇心的關(guān)系。
如果計算機程序遇到棘手的問題,無法第一時間搜索到解決方案怎么辦?科學(xué)家說,讓人工智能具備好奇心可能是最終答案。
加州大學(xué)伯克利分校的研究人員開發(fā)了“內(nèi)在好奇心模型”,讓人工智能算法在沒有強反饋信號的時候,仍然主動進行學(xué)習(xí)。開發(fā)這一模型的團隊在玩游戲時受到了啟發(fā)。他們希望能夠用人工智能軟件控制虛擬人物,提升人物對游戲環(huán)境的理解,尤其是影響其自身的一些方面。雖然此前也有其他研究人員嘗試給人工智能“裝上”好奇心,但往往都非常簡單。
如果人工智能真的能擁有好奇心,那么今天我們所面對的大多數(shù)機器學(xué)習(xí)技術(shù)弊端將得到解決,同時,我們也能讓機器更好地服務(wù)于現(xiàn)實世界的問題。
Pulkit Agrawal是加州大學(xué)伯克利分校的博士學(xué)生,同時也是該項目研究成員之一,他說:“在現(xiàn)實世界中,好奇心所能獲得的回報太少了。小寶寶們經(jīng)常有這種實驗行為,你可以把它看作一種好奇。其實,他們是在學(xué)習(xí)某種技能。”
近幾年來,一些強大的機器學(xué)習(xí)技術(shù)已經(jīng)讓機器一天比一天聰明。值得一提的是,一種名為增強學(xué)習(xí)的技術(shù)已經(jīng)能讓機器解決復(fù)雜問題,而這些問題如果轉(zhuǎn)換成代碼是非常困難的。在進行增強學(xué)習(xí)的過程中,算法作出正確決策會得到獎勵,從而引導(dǎo)算法行為朝著目標方向邁進。
在DeepMind開發(fā)的AlphaGo中,增強學(xué)習(xí)技術(shù)也為其提供了基礎(chǔ),才使AlphaGo能夠把復(fù)雜抽象的圍棋玩得那么溜。研究人員表示,探索增強學(xué)習(xí)技術(shù)的使用途徑或?qū)⑹箼C器具備人工編程無法設(shè)計的技能。比方說,未來的機械手臂可以自己訓(xùn)練,學(xué)會如何做家務(wù)。
不過,增強學(xué)習(xí)技術(shù)也有局限性。Agrawal指出,指導(dǎo)機器學(xué)會一項技能需要大量訓(xùn)練工作,而如果不能立即得到訓(xùn)練反饋,這個過程還要更加困難。舉例來說,在訓(xùn)練機器玩游戲時這項技術(shù)就不好使,因為某些操作可能不會立即顯現(xiàn)出效果。這種情況下,如果機器有好奇心就好了。
于是,研究人員試著給機器“裝上”好奇心,并結(jié)合增強學(xué)習(xí)技術(shù),拿兩款簡單小游戲做了實驗。一款是經(jīng)典游戲《馬里奧兄弟》,另一款是基礎(chǔ)3D射擊游戲VizDoom。
在兩個游戲中,擁有好奇心的人工智能系統(tǒng)學(xué)習(xí)起來要更有效率。比如說玩3D游戲的時候,人工智能系統(tǒng)沒有花多少時間撞墻,而是在游戲環(huán)境中走來走去,學(xué)習(xí)如何快速移動。即便沒有看到任何回報,它還是非常出色地掌握了兩款游戲。在《馬里奧兄弟》中,它學(xué)會了觀察周圍環(huán)境,不會莫名其妙就被殺掉。
今年晚些時候,總結(jié)此次研究的論文將會在一場大型人工智能會議上發(fā)布。
“給人工智能系統(tǒng)裝上好奇心”這一研究課題稱為熱門已經(jīng)有一陣子了。法國計算機科學(xué)與自動化研究機構(gòu)的研究主管Pierre-Yves Oudeyer是這方面的“拓荒者”,在過去幾年里,他率先對計算機程序及機器人的基礎(chǔ)好奇心項目進行了研究。
Oudeyer表示:“現(xiàn)在讓我覺得激動的是,被主流人工智能技術(shù)和神經(jīng)科學(xué)研究人員當作‘詭思異談’的時代已經(jīng)過去了,現(xiàn)在“給人工智能系統(tǒng)裝上好奇心”正成為人工智能和神經(jīng)科學(xué)領(lǐng)域的重要主題。”
人工智能搭上好奇心將帶來許多實實在在的好處。加州大學(xué)伯克利分校的團隊希望能在機器人身上運用這一技術(shù),讓機器人學(xué)會如何抓住笨拙的物體。Agrawal說,機器人往往浪費大量時間進行無意義的動作,而如果它們天生擁有好奇心,那么或許可以更快地了解周圍環(huán)境,和身邊的物體積極進行互動。
紐約大學(xué)科學(xué)研究員Brenden Lake致力于開發(fā)擁有人類認知能力的計算模型,在他看來,上述研究是很有前景的。Lake在一封郵件中說:“讓機器擁有好奇心等能力是往前邁了重要一步,讓我們離開發(fā)出具備等同于人類的學(xué)習(xí)、思考能力的機器人又近了許多。令我驚訝的是,僅僅依靠好奇心驅(qū)動學(xué)習(xí)技術(shù),人工智能系統(tǒng)居然能在馬里奧游戲里升級,要知道那系統(tǒng)根本就沒有關(guān)注得分。”
與此同時,Lake也表示,這一新項目所展示的人工智能好奇心,和孩子的好奇心還是不同的。人類對世界的求知欲往往更強烈一些。
“這是一種非常以自我為中心的好奇心。”Lake說道。
“人工智能系統(tǒng)只關(guān)心與自己有關(guān)的環(huán)境特點。而人的求知范圍要更廣。人們想了解的,不僅僅是與自身行為有關(guān)的世界。”
本文來自獵云網(wǎng),如若轉(zhuǎn)載,請注明出處:http://www.lieyunwang.com/archives/315484