朱頻頻
今年的兩會中,人工智能首次寫入了政府工作報告。這給行業帶來了一些新的不確定性的因素,因為人工智能行業又被炒起來了。據我所知,一些投資機構、學校,特別是好多大學,不管有沒有自己的研究和實力,都開始一窩蜂地涌入人工智能領域。
人工智能寫入政府工作報告是一個很大的利好,但是可能一定程度上會干擾市場,以及干擾一些投資者的判斷。因為原來我們業內有一個共識,就是關于人工智能大致的投資、行業發展方向是怎樣的,朝什么方向、以怎樣的節奏發展是比較健康的,但是現在可能會面臨更多的不確定性。一些行業外的人和資本,可能因為外部環境的變化,帶來更多的渾沌。
在我看來,短暫時間內這又會有一場人工智能的泡沫。這對市場是一定的干擾,干擾了市場本身健康的成長。不過從長遠來看,這對人工智能行業是一個積極的事情。
做平臺型的人工智能企業99%會死
最近看到有一個觀點:未來兩三年95%以上人工智能公司會倒閉。其實這個問題要具體分析,人工智能行業的公司細分類型不一樣。
目前人工智能企業大致可以分為三類。第一類是純粹做人工智能基礎,技術開發的,這一類往往是百度、阿里巴巴、騰訊或者谷歌這樣的科技巨頭來做,因為他們想做自己的開源平臺,讓大家都來使用。
第二類是有自己的基礎開發能力,但是在細分領域中能夠沉淀下去,做細分領域的應用的。像我們的小i機器人就屬于這一類。這樣的企業能夠自己支撐自己的發展,也是目前在業內生存得比較好的,一個重要的原因是技術可以落地,實現貨幣化,也就是有收入。
第三類是純做應用的。自己不做人工智能的技術開發,去使用別人的技術,比如海康威視在攝像頭領域的量是很大的,因為它擁有市場,所以它在人臉識別方面擁有大量的客戶、數據來源和渠道,它雖然使用別人的人工智能技術來進行人臉識別,但依然能夠很好地生存。
我認為第一類的創業企業或者中小公司,99%的企業都會死,不僅僅是95%了。因為做人工智能的企業如果僅做純粹的基礎技術研發,那就是在跟BAT這樣的企業直接競爭。我相信這類企業,99%都會做不下去。不論是人才層次,資金投入,還是市場競爭,在人工智能基礎的研發上,小公司難以跟BAT這樣的大企業對抗。
但如果是在細分行業中做應用,將人工智能的技術在某個領域提供很好的服務或產品的話,那可能會活得很好,這一塊的市場非常廣闊。
其實近期在經歷了一段時間的人工智能浪潮以后,好多企業都開始出現一些經營困難。我知道一家做智能音響的企業,是想模仿亞馬遜,這個公司沒有自己的云計算作為基礎,也去做智能音箱。
如果這個公司有自己的云計算、大數據,能夠自己搜集用戶數據,并且對數據進行分析,可能會做得不錯,但是它又沒有亞馬遜那樣比較雄厚的資金實力,自己又沒有人工智能的技術開發,結果自然做不下去,出現了經營困難。
因為人工智能有四個層面,云計算,大數據,人工智能,行業應用。云計算是獲得數據的前提,大數據是人工智能的前提,而行業應用則是保證企業能夠生存,以及人工智能得以發揮效用的關鍵。前三個層面是行業應用的一個基礎,行業應用是一個人工智能企業能夠生存和發展的動力。
對人工智能的預期需要降低
人工智能其實是個不斷進步的概念,存儲盤、計算機,其實這些都是第一次人工智能浪潮的產品,但如今我們都已經習以為常了。
第一次人工智能浪潮,是以PC(計算機)為代表的,因為那時候我們看到計算機可以記憶信息、處理程序,我們就覺得很驚奇。PC的出現讓大家看到了機器代替人類思考、工作的希望,大家對人工智能抱有非常大的期待。但是后來發現,技術的積累和計算能力各方面都不具備,所以在1970年左右的時候,有很明顯的低潮。
第二次人工智能浪潮開始于19世紀80年代,到2000年左右進入一個低潮,主要以日本研究第五代計算機為代表。第五代計算機的特征就是邏輯推理、語言組織,當時想把計算機做成具有強大能力的推理機,可以像人一樣做邏輯思考,希望通過比較復雜的邏輯推理模擬人的思維。
簡單而言,那時候主要的想法是,人類的思維應該是有一定的邏輯的,只要計算機把人類的邏輯模擬下來,人工智能的能力就能夠得到很大的提升。
但后來我們發現,人類的很多能力并不是靠邏輯思維得到的。真正具備嚴密的邏輯思維對人是少數,或者說生活中使用嚴密的邏輯思維的場景是少數。人類的智能,很多時候還是比較模糊,但又很直接的判斷。我們解一個數學題,可能有比較嚴格的邏輯,但是我們做人臉識別的時候,其實沒有辦法把它表示成一個非常嚴密的邏輯的過程。所以第二次人工智能浪潮中很多的東西做得不是太理想。2000年左右投資減少,不僅僅是風險投資,還有政府對人工智能的投資也減少了,因為大家覺得可能性不是太大。
第三次的人工智能浪潮,則普遍被認為是2006年加拿大的Hinton教授一篇關于深度學習在圖象識別當中的應用的文章帶動起來的。目前的第三次人工智能浪潮就是以深度學習為代表的。深度學習是機器學習的一種,一般叫深度神經網絡,或者叫多層的神經網絡。
機器學習與前面提到的嚴密的邏輯思維的人工智能的區別在于,機器學習類似于統計,邏輯思維是演繹。統計的方法,可以通過大量的標注好的數據,去找到規律從而形成模型,這個模型就可以幫助我們去做一些任務,比如說像人臉識別,語音識別的任務。
原來機器學習是單層的,深度學習是多層的,能夠對數據信息進行加工、總結。簡單地說,就是在大量的數據中,人工智能自己去發現數據之間的聯系、規律,原來是人類去給計算機設定思維邏輯,而深度學習則是計算機自己對數據信息進行總結、抽象,并發現其中的規律。所以我們如今的圖像識別、語音識別,都是如此。
舉個例子,對一張人臉,也就是一個圖像進行識別,原來可能需要用戶坐好,表情端正,然后機器根據不同部位的特點、定位來進行判斷是不是這個人。但我們人腦不是這樣工作的,同一個人,不論是哭、笑,喜怒哀樂,我們都知道是這個人。深度學習就能夠將這些信息數據進行抽象、總結,然后輸出結果,比如確認你就是這臺電腦的用戶。
在其他領域,也是如此。比如你給了一幅畫,它通過分析告訴你這幅畫有一個太陽,一座山,兩個人;你給了一段中文,它可以幫你翻譯輸出為英文或日文;你給了一段語音,它轉換成了文字。但一個特點就是深度學習需要大量數據的輸入,沒有大量的數據來進行分析,是沒有辦法得到很好的結果的。
有的領域,技術不是問題,但是人們對人工智能帶來的市場需求預期過高了。比如圖像識別這塊,目前圖像識別領域只有一個市場需求在支撐,那就是人臉識別。圖像識別的技術已經發展得比較成熟了,但是我們發現人們對人類識別的需求并不是那么大,市場需求不足。
去年下半年開始,受資本寒冬影響,經歷過一些投資的泡沫和人工智能的行業探索后,人工智能有一個理性的回歸。行業內對于人工智能能夠做什么,不能做什么,跟前兩次人工智能浪潮相比,期望是降低了的,這也有利于人工智能自身的發展。
我們對人工智能的期待程度其實是需要降低的。人工智能就是代替人完成一些人類不愿意做的,比如服務員、簡單的文字處理、簡單的法律服務這樣基礎性、重復性的工作,從而讓人類去做更有創造性的事情,它不是萬能的。
(作者朱頻頻系小i機器人總裁兼CTO,本報記者劉創采訪整理)