
新浪科技訊 北京時(shí)間5月21日上午消息,工業(yè)機(jī)器人大都是一遍又一遍地重復(fù)已經(jīng)明確編程好的任務(wù)。通常來講,這意味著執(zhí)行這些任務(wù)的機(jī)器人會(huì)與給它們編程的脆弱的工程師們保留安全距離。然而,越來越多的研究人員正在思考機(jī)器人如何在充滿人類的環(huán)境里工作,甚至向他們學(xué)習(xí)。例如,英偉達(dá)公司目前在西雅圖的新機(jī)器人實(shí)驗(yàn)室里專注于一項(xiàng)研究——該公司的研究團(tuán)隊(duì)今天在澳大利亞布里斯班舉辦的機(jī)器人與自動(dòng)化國際會(huì)議(ICRA)上展示了機(jī)器人觀察人類的實(shí)驗(yàn),并介紹了其最近的一些關(guān)于機(jī)器人教學(xué)的工作。
正如英偉達(dá)的機(jī)器人研究高級(jí)主管Dieter Fox(他同時(shí)也是一位華盛頓大學(xué)教授)告訴記者的那樣,該團(tuán)隊(duì)希望啟用一種能夠在靠近人類的條件下安全工作的新一代機(jī)器人。但要做到這一點(diǎn),這些機(jī)器人首先需要能夠檢測(cè)人類,跟蹤他們的活動(dòng),并了解他們?nèi)绾螏椭藗儭热纾谛∫?guī)模的工業(yè)環(huán)境中,或是某人家中。
雖然有可能通過機(jī)械的重復(fù)來訓(xùn)練某個(gè)算法,好讓它能成功地玩電子游戲,并教導(dǎo)它從錯(cuò)誤中學(xué)習(xí),但福克斯認(rèn)為,這種訓(xùn)練機(jī)器人的方式可能會(huì)因?yàn)闄C(jī)器人要做決策的內(nèi)容太多而無法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay領(lǐng)導(dǎo)的英偉達(dá)研究小組開發(fā)了一個(gè)新系統(tǒng),能允許機(jī)器人算法通過簡單地觀察人來得到教導(dǎo),以執(zhí)行新的任務(wù)。
這個(gè)例子中的任務(wù)非常簡單——只需要堆疊幾個(gè)彩色的積木即可。但這也是在這整個(gè)漫漫長征路中邁出的重要一步,好讓人類能夠快速教授機(jī)器人的新任務(wù)。
研究人員首先訓(xùn)練了一系列的神經(jīng)網(wǎng)絡(luò)來檢測(cè)積木,推斷積木之間的關(guān)系,然后生成一個(gè)程序,來讓它反復(fù)目睹人類表演的各個(gè)步驟。研究人員說,這個(gè)新系統(tǒng)能讓他們訓(xùn)練機(jī)器人在現(xiàn)實(shí)世界中只通過一次演示來完成這個(gè)堆疊任務(wù)。
這個(gè)系統(tǒng)的一個(gè)很好的地方在于——它可以對(duì)正在執(zhí)行的步驟產(chǎn)生一個(gè)可讀的描述。這樣,研究人員就能更容易地找出發(fā)生錯(cuò)誤時(shí)的具體情況。
英偉達(dá)的Stan Birchfield告訴我,該團(tuán)隊(duì)旨在為非專業(yè)人員提供機(jī)器人培訓(xùn),并且很少有其他任務(wù)能夠比展示堆疊積木等基本的任務(wù)更容易。在這個(gè)例子中,正如英偉達(dá)團(tuán)隊(duì)在布里斯班展出的那樣,有一臺(tái)攝影機(jī)負(fù)責(zé)觀看現(xiàn)場(chǎng),人類只是走上前去,拿起積木并堆疊起來。然后機(jī)器人反復(fù)地重復(fù)這個(gè)任務(wù)。這聽起來很簡單,但對(duì)于機(jī)器人來說這是一項(xiàng)非常艱巨的任務(wù)。
為了訓(xùn)練核心模型,英偉達(dá)團(tuán)隊(duì)主要使用模擬環(huán)境中的合成數(shù)據(jù)。正如Birchfield和Fox所強(qiáng)調(diào)的那樣,這些模擬可以快速地訓(xùn)練機(jī)器人。畢竟,在現(xiàn)實(shí)世界中進(jìn)行培訓(xùn)需要更長的時(shí)間,而且還會(huì)更加危險(xiǎn)。對(duì)于大多數(shù)任務(wù),并沒有提前可供參考的培訓(xùn)數(shù)據(jù)。
Birchfield指出:“我們認(rèn)為模擬是一種強(qiáng)有力的范例,可以讓機(jī)器人訓(xùn)練以前不可能做的事情。” Fox回應(yīng)了這一說法,并指出這種模擬的需求正是英偉達(dá)認(rèn)為其硬件和軟件非常適合這種研究的原因。畢竟,這個(gè)培訓(xùn)過程有著非常強(qiáng)烈的視覺效果,而英偉達(dá)在圖形硬件方面的專業(yè)背景肯定會(huì)有所幫助。
福克斯承認(rèn),仍有大量的研究需要繼續(xù)完成(畢竟,大多數(shù)模擬并非是實(shí)際情況),但現(xiàn)在至少已經(jīng)有了核心基礎(chǔ)。
未來,英偉達(dá)團(tuán)隊(duì)打算進(jìn)一步擴(kuò)大機(jī)器人可以學(xué)習(xí)的任務(wù)范圍,并多多找一些辭藻來描述這些任務(wù)。(青卡)

“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)

公眾號(hào)

新浪科技
新浪科技為你帶來最新鮮的科技資訊

蘋果匯
蘋果匯為你帶來最新鮮的蘋果產(chǎn)品新聞

新浪眾測(cè)
新酷產(chǎn)品第一時(shí)間免費(fèi)試玩

新浪探索
提供最新的科學(xué)家新聞,精彩的震撼圖片