
新浪科技訊 12月1日下午消息,在今日舉辦的“全球思想盛筵-人工智能與人類文明”上,來自Open AI戰略與傳播中心主任Jack Clark與加州大學伯克利分校計算機視覺教授馬毅、斯坦福大學計算機學院、人工智能實驗室教授Yoav Soham、前金山CEO、源碼資本投資合伙人張宏江進行對話,探討全球人工智能技術最新趨勢。
張宏江表示,人工智能已經出現了投資泡沫,在學術方面也有泡沫,人們都希望走捷徑。深度學習、機器學習快速發展,已經有很快的步伐了,現在應該冷靜下來看一下AI的實際情況,看看方向是否正確,是否應該退后一步,應當重新審視AI的現實問題。
對于機器超越人類的擔憂,張宏江認為,不確定機器學習究竟什么時候能夠超越人類智慧,因為他們不光需要有邏輯和計算能力,還需要有情感的共鳴,只是大家不要去害怕未來的發生。
人工智能發展哪些因素最重要?加州大學伯克利分校計算機視覺教授馬毅稱,AI的漢語名稱人工是排在智能前,我們始終強調人類的智慧和人類的設計標簽。計算法、模型也非常有用,能夠幫助消化和處理更多的數據,所以這三個原因都有助力,這三個因素都是相輔相成。
談及AI的快速發展,斯坦福大學計算機學院、人工智能實驗室教授Yoav Soham表示,AI不僅就發展速度極快,而且在應用方面也是讓人吃驚的。今天AI主要是由機器學習為支撐的,但是兩者也不是完全重疊的,實際上有了這樣的機器學習和數據支持才有AI的技術。(澤宇)
以下為對話實錄:
Jack Clark:謝謝各位讓我們參加第一次的圓桌論壇,也感謝各位的參與,今天想聽聽各位探討一下AI的進步。當我們提到AI的進步,在過去的二十年我們有三個基本的理由,首先是大規模數據的應用,第二是快速計算機的計算能力,第三是新的算法,大家考慮到這些進步的話,我想問問哪個因素導致的進步因素最大,哪個是最小的?這三個因素中哪個影響最大?
馬毅:為什么說AI這么成功,成為了現象級的事件?我覺得任何現象級的事件都有很多里程碑的事件,有多因素的推動。如果沒有多因素推動,在高速運轉下不會有這種成功。我們知道市場競爭非常快速,還有我們的分布式計算的能力都提高了,在過去五年到十年中顯著提高了。同時數據的數據和有標志的數據都提高了特定領域的機器學習能力。
中國的翻譯是叫人工智能,而且在中文中人工是排在智能前,我們始終強調人類的智慧和人類的設計標簽。計算法、模型也非常有用,能夠幫助我們消化和處理更多的數據,所以這三個原因都有助力,這三個因素都是相輔相成。
應用本身在積極應用大數據,所以我想正是這幾大要素一塊來促使這個故事能夠走向成功。
Yoav Shoham:我能重復你的答案嗎?我非常贊成你的想法,數據、計算能力、算法這三大要素的確是背后的推手。
張宏江:在過去的十年隨著移動互聯網的興起讓我們感受到了數據的質量在不斷提升,我們也更加深層次介入到整個數據處理系統的建設,移動互聯網在過去的十年,尤其是五年,中國在世界上占有首位的地位,因為中國的人口數量占有絕對優勢,而移動互聯網也就此興起,移動支付像頭條努力推的以及相關的應用非常成功。
在過去的15年、20年,因特網和互聯網都是在桌面上來操作的。同時在過去15年中國企業始終找美國企業來對標,但是現在有了對標沒有辦法找到美國的對標企業,因為我們基本上是美國企業來模仿、學習中國企業的,所以我們看到學習方向的對調性。
在過去到現在我們的理念似乎調了個頭,從中國企業學習美國到美國企業學習中國。像頭條這類的應用,可以說收集了相當多的高質量數據。也為我們設計了新的系統、新的算法,也整個推動了AI引擎的發展。
從移動端的數據和電腦端的數據,在過去的幾年可以說也是AI發展的重要推力。
Jack Clark:剛剛您提到過了不光是幾大市場,不光是幾大中美的市場能夠真正做出一些貢獻,還有日本以及像歐洲的企業也不可或缺。您剛剛說到了數據,數據當然非常關鍵,現在的數據庫、數據集是海量的,也為我們提供了新的創新能力。當然源頭都是計算能力,因為我們要用計算能力去培訓、去設計模型。在國際社會上我們有一些基本的趨勢,大部分的AI企業都會購買很多芯片,包括一些圖象處理的芯片,因為這些是一些基礎芯片。那再過幾年包括像今年有新型計算機,像一些做軟件處理的企業會自己生產一些新的芯片,包括在美國、歐洲,像谷歌有自己的芯片生產公司了。
我們現在有快速的芯片生產和設計能力,而且是專門針對神經網絡的,這對科學和商業化有什么樣的影響,或者說有什么樣更多的機遇出現呢?
張宏江:我首先來回答這個問題,你剛剛描述了這一輪推動AI發展的三大要素,我覺得這不光是一個廣泛意義上的計算能力,更是一種核心計算能力。比如說一個小的創新公司沒有錢去購買大型高端的服務器,你可能就在云平臺上工作,因為云也是這個時代的創新。你看到越來越多的特殊芯片的時候,你也會慢慢地感受到整個人工智能從云平臺真正走向了終端,我們是從頂端走向終端的過程。
在這個過程中就會誕生很多新的創新,包括像家庭的人工智能,還有相關的一些應用。比如說你可以感受一下過去幾年在國內有一些智能的交通,相關的一些生活應用會越來越多。所以中國的市場未來潛力也是非常大。
Yoav Shoham:我待會再說,因為我覺得前面嘉賓都把我的話說完了。
馬毅:你剛剛說到了我們的算法,尤其是循環算法的發展。我們現在的局面和階段可以說是資源有限,所以我們反復把模型越做越深,數據量越來越大。像谷歌這樣的企業、臉書這些企業是背后重要的推力。但是從規模經濟的角度來說,我自己是做算法的。我覺得遲早人們會意識到我們的計算能力是有限的,肯定是有邊界的,就只往效率方面提升。我們在開發算法的時候,特別是算法的培訓,針對神經網絡大型模型的神經網絡培訓的時候,我們發現算法是上世紀九十年代出來的,很慢,沒有八十年代的效率高,為什么會出現這種情況呢?因為沒有辦法去擴展,沒有辦法去提升。回到五十年代看看當時的算法,其實最有效的算法是五十年代出來的,很多是由俄國人寫出來的,他們的技能和商業化應用都很好。
那么這就讓我反思,可能資源太多不利于創新。
Jack Clark:你的意思是說人變懶了,懶于思考,因為計算機代替了人類思考。
馬毅:一定程度上的確是,我們可以用GPU和CPU來取代思考,就好像我們資源無限、數據無限。我覺得這只是暫時的現象,因為任何企業要有競爭力的話,你一定要有效率,你一定要有提高計算效率的一種能力,所以更有效率的芯片和算法才能夠真正確保未來AI的美好前景。
Jack Clark:就你的這個點我覺得很有意思,比如你跟學生在溝通的時候,你是不是不讓他們用最新的GPU?你說你要用上個世紀的GPU,因為算法更有效?
馬毅:其實這也是我的一個焦慮,因為學生每個月都跟我抱怨我的算法已經過時了,你能不能再買幾個GPU、CPU,我可以幾個小時就可以完成我的算法。這種對話經常在辦公室發生,他們經常來找我抱怨。我一直強調,其實兩年前我們可能只有簡單處理數據的芯片,但是當時也沒有阻止我們去進行創新,所以我總覺得現代所有的像機器學習和計算機視覺的技術并不能幫助我們解決所有的問題。我覺得大家考慮的就是怎么樣能夠提高效率來使用資源。
Jack Clark:我還有下一個問題,您剛才說到新的芯片能夠產生新的應用,尤其是有移動互聯網的應用。那么能不能給我們更多的案例,究竟什么樣的企業是真正做到了創新,能夠利用云平臺來發展自己的大數據和AI的能力?
張宏江:我其實不好直接說兩大領域,因為整個行業的領域非常多,他們都能夠從中受益,都能夠受到新芯片發展的一些好處。假如說看看中國的城市有很多攝像頭,街上就有攝像頭。我不知道是不是您第一次來北京,假如你在北京機場下來之后可能會意識到要通過幾個門。比如說你在登機前要走安檢門,基本上安檢門處有一個掃二維碼的來掃登機牌,所以會提示你是否準時登機了。
同時你還可以去托運你的行李,假如說你的時間不夠了,到登機門的時間不夠就讓你停下來了,你就沒法登機,你也沒有必要跑到登機們,這就是簡單的應用來測算你的時間。或者說在大街上也有攝像頭,攝像頭背后被稱為城市大腦,城市大腦為城市監測和管理規劃整個交通流。我知道我們來開會之前就知道自己快要遲到了,因為這邊有交通管制。
我想未來這種情況也是可以避免的,我們會有一種方法來確保你在開車的時候不會受到其他駕駛員的影響。比如說臉部識別,最開始我們有一些APP能夠捕獲一些數據,然后把這些數據或者視頻發送到云端。但是現在在中國絕大多數的視頻、攝像頭可以直接在自己的設備上做臉部識別了,不需要再上傳到云端了。在中國我們在這個技術方面,已經有了一些世界領軍的企業。
Jack Clark:謝謝你的分享,我們在探討無人駕駛之前,可能先要處理交通擁堵問題,利用AI是會給大家帶來驚喜的一個技術。
三位都曾經在AI方面有很多年的工作經歷,我在想如果我們有一個時間機器回到十年之前,你覺得我們的這種進展能夠走到今天的地步嗎?你覺得十年之前會因為今天的局面而感到非常震驚嗎,想到未來十年會是這樣子?
Yoav Shoham:我覺得回到十年前看到今天這種場景的話,我會對朝這個方向取得的飛速發展而感到非常差異。今天AI主要是由機器學習為支撐的,但是兩者也不是完全重疊的,實際上有了這樣的機器學習和數據支持才有AI的技術。
另外,不僅就發展速度上很吃驚,而是說有很多應用也是非常讓人吃驚的。近期有人預測我們可能會超過計算機給大家帶來的利益,我想人們一定會吃驚的是在很多其他的領域,比如說人類推理也是可以應用到AI的,你會意識到可能機器人的智能能夠超過一個5歲的兒童,這是會讓你感到非常震驚的地方。
張宏江:我非常同意Yoav Shoham的觀點,我們取得的杰出成就確實是令人吃驚的。當我剛開始了解到深度學習文件的時候,我腦海中出現的事情是這個事情是在25年前就有的東西,當時在八十年代就有了,大家都覺得這是一個很好的推理工作的重要工具。但是25年前還沒有深度的發展,現在和當時發展的局面已經非常不一樣了,因為我們有很多的數據來支持深度學習。過去25年里,我們所取得的進展是比我想象得要更加具有變革性的。
馬毅:公共領域可能會覺得有一些事情已經越過了一個門檻,這些應用確實發生了一些事情超過了他們的界限。像大計算這樣的東西,我二十年前畢業了,我當時和現在的情況是不一樣的,我當時找到了一份控制體系的工作,但是剛畢業時沒有找到大計算方面的工作。后來又花了二十年的時間,這個行業才取得了智能化的發展。我剛畢業的時候計算是非常小的領域,但是現在我覺得已經是一個非常大的領域了。像會議有5000個人的規模來參加大會都是有可能的。
但是像臉部識別這樣的技能在它真正能發展到一定級別,比如可以做一些實時的設置或者實時的設備技術等等,大眾一般不會覺得它是可用的。只有當達到了正面的時候才會使大家歡迎,在學術界來說我們是知道的,是有發展逐步漸進的過程。我們看到大計算的發展是有根本性的變化,但是真正要應用到大眾心理的話,還是需要朝這個方向做一些逐步的努力。
Jack Clark:我想您的觀點,我們很多AI現在的模式都是基于大量的數據,你有電腦,你了解了一些模型,這些模型可能是非常復雜的,你可以拍一張照片,或者自動地去儲存它,但是總會給你留下印象深刻的結果。但是機器學習和人類的常識不是一樣的,機器學習和人類的推理過程也是不一樣的,是不是在推理方面的進展還比較慢呢?
馬毅:我一開始是控制學方面的專家,我做了機器人控制系統的開發。我覺得我們的愿景應該讓計算機能夠利用我們的環境采取相應的行動,大概二十多年前,曾經有教授說我們應該執行行動,這才是機器人的關鍵。現在我們有很多計算機系統,有一些物品,看到了這些物品就發送一些照片采取一些行動。但是真正能夠讓這個機器成為一種可行動的信息源的話,還是要有一定的時間。就像人類一樣,我們可以看到這個世界,但是我們要和真實世界有溝通、有互動,比如控制這個水瓶,然后能夠自動做出一定決定、執行一定的任務,這些是機器未來的發展方向。但是這方面還沒有實現這個目標,我們確實有一定視覺上的圖像發展,但是距離真正理解整個世界、整個環境的復雜性來說,機器人還是有一定距離的。
不僅是幾何學,另外還有各種學科可能對于機器人學會掌握都是比較復雜的。另外還有視覺、語音是封閉的體系,可能駕駛也是其中的一個封閉體系,我們首先要做機器人的測試來看這些AI的能力是如何的。
Yoav Shoham:我覺得你說的很對,我們現在所生活的世界是非常復雜的識別過程。處在這樣的情景中,包括你的商務需要有各種特征需要你捕獲,有的時候是以事件為基礎的,有的時候是以狀態為基礎的。如果特征交到你手里的話,可能是圖片的形式,可能是財務數據或者是客戶購買數據,這就是你業務的開始了。但是世界上絕大多數的問題并不是這樣的方式來解決的,我們可能并沒有機器能夠隨時幫助我們解決這些問題。
過去比如說在幾萬年的時間里,人類都致力于用語言來描述世界的現象,覺得語言是有深度結構化的。7萬年前人類就有了這種能力,所以機器還需要花很長時間來跟上人類的步伐來做深度語義結構化。
張宏江:我覺得Yoav Shoham剛才想解釋的是,在深度學習方面還是有許多其他的方面是AI需要更多關注的。很不幸的是,正如剛才說的一方面你能看到我們現在有一些會議的規模越來越大了,對于一些企業來說也越來越受到追捧,很多贊助商愿意贊助AI的企業,這就是它的熱度了。當然我很高興看到這種趨勢,但是另一方面你一定要捫心自問,深度學習是唯一的方式嗎?是唯一能夠解決我們現實世界問題的方式嗎?AI的未來是怎樣的呢?我覺得很不幸,現在已經有了一定的投資泡沫,在學術方面也有AI方面的泡沫,人們都希望走捷徑。
如果有一個領域突然火起來了,就會有很多的學術文章、很多的投資流向這個領域。就過去的這些年而言,我覺得深度學習、機器學習快速發展,已經有很快的步伐了,現在是時候讓我們冷靜下來捫心自問看一下AI的實際情況,來看看是不是繼續這方向,還是說是不是應該退后一步、清醒一下重新審視現在的現實問題。
Jack Clark:我也想提出一個觀點,大家提出來的是非常受歡迎的觀點,可能是大家之前在私底下有類似的想法,今天是第一次展現在公眾面前。我也是類似的觀點,如果培訓、訓練的是無人駕駛汽車、機器人體系,可能有一個模擬器想要模擬整個現實世界的真實情況,然后以更快的速度、超越現實的速度來進行這樣的模擬。但是現實世界是很難像我們想象那樣輕易構建起來的,實際上我們手頭的資源并不是很充足。
另外剛才大家談到了一點,一旦我們有了一個經典的體系可以能夠提供機器人行動,另外可以智能化去學習的話。我覺得具體怎么去實現這一點還是沒有現有答案的,當然我們都描繪了很好的藍圖,都有很好的激情希望未來是怎樣的。也有一些領域是投資不足的,如果投資不足的話可能發展速度會下來,但是這可能只是我的一個觀點,大家有沒有類似的觀點?
馬毅:我可以簡要地補充一下您剛才的這種假設,因為我們看到過去的發展進程,簡直就是螺旋式地上升。如果你和楊樂坤(音)交流的話,他在幾個月前訪問過我們,他曾經說過如果你看一下像阿波羅這樣的想法,其實已經有了這些神經學習了。至于控制力,你要了解它的一些具體的參數,也就是控制體系參數的控制。對于整個體系能夠很好地學習,并且能夠適應我們環境的話,這方面的研究一定要是關于控制理論、控制體系方面的理論。我們可能要研究個五十年,可能要學習不同的模型、不同模型之間的區別。
我們可能要有一些計算機的應用來輔助研究,但是概念已經形成了。關于監督式的學習,我們現在就是有了適應性的控制系統作為支持才能取得發展。另外還有各種的模型,就是因為有神經網絡的支持才能實現,所以創新的產品是很多的,在不同的背景下有不同的應用。但是最終我們需要有知識,許多的想法、許多的觀點比如說關于體系、關于控制理論的,他們需要應用到我們的機器學習理論中來。
而且我可以和大家分享一下,關于信息理論現在有很多的說法,到底我們的神經系統在做什么?我有朋友來自于AIT,他跟我曾經說過,我們確實有做分類的神經體系,從信息的角度去做。在這個網絡中,我們監督式的系統做的事情是非常清楚什么是可以做的、什么是不可以做的,這樣的清晰度就能夠驅動我們、了解我們的局限性,而且會考慮到合作的重要性,比如說和常識進行連接,和人類的智慧進行連接,共同和AI一塊走向未來。
Yoav Shoham:我有兩點可能是有一點點不同,分別是從短期和長期來看。在短期來看,我覺得你的觀點好像更多是關注視覺化,所以我在學術和業界都有AI的實踐。同時我也關注未來圖像的變化。
我們現在也在發展一個卡通形象,因為我在小時候當孩子在看星空的時候,就會感覺到星空的美妙。當時還拿了一個凳子,為了離星空更近一點,這就像我們對待AI的態度一樣,我們現在只是拿著凳子站在上面,而數據就是凳子本身,未來的路非常遠,前景非常激動。但是確實是一個任重道遠的事情,這是我的第一點觀點。
從長期來看,我們已經有很多潛在的障礙了,比如說拿500年的時間界限來看,500年是一個上線不是下限。500年很好理解,因為遲早機器會超越人類的智慧。
張宏江:我是做業界的,我來自于產業。在過去幾個月也花時間在思考,我在跟學界的人去溝通,看看他們的一些學術的探討。我很想從他們的臉上讀到的答案就是深度學習已經有很多成果了,也有很多相關的工具。還有很多工程師,也知道深度學習該怎么樣去打造系統。現在是不是已經到了一個時刻,這些研究人員可以來看一看業界的東西,而不光是在實驗室來看他們的理論,我覺得大家可以看一看超越在簡單的強化學習之外的工作,看看新的學習參數、新的方法能夠為我們帶來新一波的創新。
整個行業是不是應該來思考整個系統性的東西呢?因為我也做系統。大家不需要一股腦地擠進一個非常狹窄的方法論學習,我覺得大家應該打開視野,來真正的真實世界來看看,這是我給學界人的觀點。
Jack Clark:我非常感謝你的勇敢的推斷,您還給了一個特地的數據。我想總結一下,在500年可能是一個上線,你可以想象機器的指揮會超過人類。
您能不能夠給我們一下您的建議,您覺得這個說法可行嗎?也可以把時限和空間的距離拉大一些。
張宏江:我想舉個我自己的例子,25年前當時我做的是臉部識別,當時我自己做了一個模型,在1993年做的,我覺得比大家的年齡還要大,1993年大家還沒出生吧,這是一個面部識別的公司。當時有一個終端來收集人的面部表情,還有一個末端能夠去處理數據,我們當時有一個分布式的計算系統來做所有后臺的運算。
當時這個模型在1993年上線,差不多二十多年了。今年已經二十多年了,我們覺得面部識別已經是一個很成熟的技術了,像我的學生、我學生的學生都在做很多面部識別的公司,他們在中國的公司還是世界頂尖的。
最終是這一天到了,他們實現了我的夢想和理想,同時他們超越了我的能力,他們在手機上就實現了面部識別,不需要背后有很大的計算機系統,也不需要用到大量的云。我就想二十年其實不短,在人的一生中二十年已經不短了,但是在人類歷史上其實只是滄海一粟,所以我非常樂觀。我不太確定機器學習究竟什么時候能夠超越人類智慧,因為他們不光需要有邏輯和計算能力,他們需要有情感的共鳴。我不太確定具體的時間,我也不知道有沒有這樣一天,只是大家不要去害怕未來的發生,也不要害怕一生的所求,你要思考你是不是能夠獲得這種能力,其實我沒有什么答案和時間。
馬毅:我覺得你已經提到這個時間點了,人類的智慧也是經歷過幾十億萬年的進化才到今天的,而且有幾十萬億個神經原。今天大部分的成就和成功都是一個短期的學習過程,我們可以把它翻譯成為簡單的人工智能,人在前,這包括人和人的對話等等。
但是現在機器學習的方法和人類學習不一樣,人類和大腦的進化是一種強化性學習,本身是強化學習的方式,這就是所謂的強化性學習。但是這是花了好多年的時間,現在人的大腦結構已經非常完善了,我們的孩子在小的時候不需要去監督他們的學習,不需要為他們去指錯,不需要培訓這是水杯或者這是什么,其實他們第一年就能夠掌握,沒有人去監督他們。他們聽取自然語言,他們去感受信號處理,他們去嘗試視覺分享,他們自己去進行人腦的組成,所以他們自己進行監督,而不是人類大人去監督。我想這是人工智能的一個演變方式。
我們現在在考慮怎么把這幾十萬億年的學習花十年讓機器去。
Jack Clark:所以你的意思是說人類比如說花了200萬年,機器花更短的時間?
馬毅:對,這個階段是很短的,我們要把幾十萬億年人類的學習時間濃縮,希望人類不要在這個過程中看不到這一天。因為確實我們要考慮到人應該怎么去適應,在非監督方式中自動適應。
Jack Clark:所以可能100年是嗎?
馬毅:其實我希望在我的有生之年能夠看到這一天。
Jack Clark:謝謝你們的分享,也謝謝所有的四位嘉賓!

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)
