AI新趨勢:打造無監(jiān)督式通用神經(jīng)網(wǎng)絡(luò)人工智能
尤爾根·施米德休伯教授是瑞士人工智能實驗室IDSIA的科學(xué)事務(wù)主管,同時任教于盧加諾大學(xué)和瑞士南部應(yīng)用科學(xué)與藝術(shù)學(xué)院。他于1987年和1991年在慕尼黑工業(yè)大學(xué)先后獲得計算機科學(xué)的學(xué)士和博士學(xué)位。
自1987年以來,他一直著自我改進式通用問題求解程序的研究。從1991年開始,他成為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)領(lǐng)域的開拓者。他在IDSIA和慕尼黑工業(yè)大學(xué)的研究團隊開發(fā)了一種遞歸神經(jīng)網(wǎng)絡(luò),并在正式的性比賽中獲勝。這些技術(shù)革新了連續(xù)手寫識別、語音識別、機器翻譯和圖片注釋,現(xiàn)在被谷歌、微軟、IBM、百度和其他很多公司應(yīng)用。DeepMind深受他以前博士學(xué)生的影響。
從2009年起,施米德休伯教授成為了歐洲科學(xué)與藝術(shù)學(xué)院的院士。他獲得過很多獎項,包括2013年神經(jīng)網(wǎng)絡(luò)協(xié)會的亥姆霍茲獎,以及2016年電氣與電子工程師協(xié)會的神經(jīng)網(wǎng)絡(luò)先鋒獎。2014年,他參與創(chuàng)辦了人工智能公司NNAISENSE,旨在打造個有實用價值的通用人工智能。
深度學(xué)習(xí)是裝載新瓶子里的舊酒
什么是深度學(xué)習(xí)?它有著怎樣的歷史?
施米德休伯:它是裝在新瓶子里的舊酒。它主要是關(guān)于擁有多個后續(xù)處理層的深度神經(jīng)網(wǎng)絡(luò)。利用如今速度更快的計算機,這樣的網(wǎng)絡(luò)已經(jīng)徹底改變了模式識別和機器學(xué)習(xí)。“深度學(xué)習(xí)”這一術(shù)語由德克特在1986年首度引入機器學(xué)習(xí)領(lǐng)域,然后由艾森伯格等人在2000年引入人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域。
深度學(xué)習(xí)之父是烏克蘭的數(shù)學(xué)家伊凡卡內(nèi)科。1965年,他和拉帕共同編寫了個用于監(jiān)督式前饋多層感知的通用可行學(xué)習(xí)算法。1971年,他已經(jīng)描述了一個八層的網(wǎng)絡(luò)(即使按照當(dāng)前的標(biāo)準(zhǔn),仍然稱得上有深度),并使用一種在新千年仍然流行的方法對它進行訓(xùn)練。他遠遠于自己的時代——當(dāng)時,計算機的運算速度比現(xiàn)在慢10億倍。
你對《科學(xué)》雜志上那篇關(guān)于人類層次概念學(xué)習(xí)的論文有何看法,它通過貝葉斯程序?qū)W習(xí)框架實現(xiàn)了“一次性學(xué)習(xí)”。施米德休伯:那篇論文很有趣。不過,我們也能通過標(biāo)準(zhǔn)的遷移學(xué)習(xí)來實現(xiàn)快速的一次性學(xué)習(xí)。方法就是,首先,基于眾多不同的視覺訓(xùn)練集“慢慢地”訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò),使得網(wǎng)絡(luò)的前10層變成一個相當(dāng)通用的視覺預(yù)處理器;
然后,凍結(jié)這10層,以高學(xué)習(xí)速率在新圖像上僅對第11層進行重新訓(xùn)練。多年來,這種方法一直運轉(zhuǎn)良好。
貝葉斯方法和深度學(xué)習(xí)方法有何異同?哪一種方法更可行?為什么?
施米德休伯:機器學(xué)習(xí)的優(yōu)化版貝葉斯法在馬庫斯·胡特2002年提出的AIXI模型中得到了體現(xiàn)。他曾是我的博士后學(xué)生,現(xiàn)在是一名教授。任何計算問題都可以被表述為一個回報函數(shù)的大化問題。
AIXI模型基于所羅門諾夫的通用歸納模型M,其中包含了所有可計算的概率分布。如果世界對一些強化學(xué)習(xí)智能體行為的反應(yīng)概率是可計算的(沒有證據(jù)可以反駁這一點),那么該智能體就可能用M(而不是其他準(zhǔn)確卻未知的分布)來預(yù)測自己未來的感官輸入和回報,它就可以通過選擇使M預(yù)測回報大化的行為序列來實現(xiàn)行動的優(yōu)化。
這或許可以被稱為人工智能的統(tǒng)計學(xué)方法——它展示了可能性的數(shù)學(xué)極限。然而,AIXI的優(yōu)化概念忽略了時間的計算,這就是我們?yōu)槭裁慈匀辉谑褂猛ㄓ眯暂^差但更可行的方法,比如基于局限性更強的本地搜索技術(shù)(如梯度下降法)的深度學(xué)習(xí)。
《科學(xué)》雜志上的那篇論文稱,其結(jié)果“通過了視覺圖靈測試”。圖靈測試這種在半個多世紀以前提出的測試方法,至今仍然有效嗎?
施米德休伯:跟我聊天的對象在我看來像是人類嗎?如果像,那么它就通過了我個人的圖靈測試。這種測試的主要問題在于,它的主觀性太強,正如維森鮑姆幾十年前所證明的那樣。有一些人總比其他人更容易上當(dāng)。
與DeepMind不解之緣
你對《自然》雜志上谷歌DeepMind關(guān)于AlphaGo的論文有何看法,它是一款擊敗了職業(yè)圍棋選手的程序。AlphaGo算是這個領(lǐng)域的重大突破嗎?是什么幫助AlphaGo取得了這樣的成就?
施米德休伯:我對谷歌DeepMind的成功感到高興,這也是因為該公司深受我以前學(xué)生的影響:在DeepMind初的四名成員中,有兩人來自IDSIA,一位是聯(lián)合創(chuàng)始人,另一位是DeepMind的首名員工,他們也是該公司早的人工智能學(xué)博士;后來,我的另外幾位博士生也加入了DeepMind,其中一位曾在2010年與我聯(lián)合發(fā)表了一篇關(guān)于“吃子棋”的論文。
在圍棋這種棋盤游戲中,“馬爾科夫假設(shè)”是成立的:原則上,當(dāng)前的輸入(即棋盤狀態(tài))包含了確定下一步佳行動所需的全部信息,不需要考慮之前的狀態(tài)。
也就是說,該游戲可以通過傳統(tǒng)的強化學(xué)習(xí)來處理。這有點像20年前的情形,當(dāng)時IBM的特索羅利用強化學(xué)習(xí)從頭學(xué)起,打造出一個可與人類世界匹敵的雙陸棋程序。
然而,到了如今,我們從一個事實中受益良多:每單位成本計算機的速度至少比以前快1萬倍。過去幾年中,自動化的圍棋程序已經(jīng)得到極大的改進。為了學(xué)習(xí)成為一位的圍棋選手,DeepMind的系統(tǒng)結(jié)合使用了多種傳統(tǒng)方法,比如監(jiān)督式學(xué)習(xí)(即向人類專家學(xué)習(xí))以及基于蒙特卡洛樹搜索的強化學(xué)習(xí)。
然而很可惜,“馬爾科夫假設(shè)”的條件在現(xiàn)實世界的場景中并不成立。這就是為什么現(xiàn)實世界的游戲(比如足球)要比象棋或圍棋更難,也正因為此,生活在部分可觀測環(huán)境中的強化學(xué)習(xí)機器人的強人工智能,才需要更復(fù)雜的學(xué)習(xí)算法,比如針對遞歸神經(jīng)網(wǎng)絡(luò)的強化學(xué)習(xí)。
近,谷歌DeepMind宣布進軍醫(yī)療市場,你對此有什么看法?施米德休伯:我們對深度學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用非常感興趣。事實上,2012年時,IDSIA的團隊就開發(fā)出了贏得醫(yī)療成像大賽的深度學(xué)習(xí)程序。
看到很多公司現(xiàn)在都將深度學(xué)習(xí)用于醫(yī)療成像和類似領(lǐng)域,我很高興。全世界每年在醫(yī)療保健上的花費占到GDP總量的10%以上(每年超過7萬億美元),其中大部分是用于醫(yī)療診斷。
實現(xiàn)這個過程的部分自動化不僅可以省下數(shù)十億美元的資金,還可以讓很多目前無力負擔(dān)費用的人享受到專家級的醫(yī)療診斷。在這種語境下,醫(yī)院寶貴的資產(chǎn)也許是它們的數(shù)據(jù)——這就是為什么IBM會在一家收集此類數(shù)據(jù)的公司身上花費10億美元。
你怎樣看待IBM的新沃森物聯(lián)網(wǎng)平臺?人工智能在物聯(lián)網(wǎng)領(lǐng)域有何潛力?對人工智能來說,“人工智能即服務(wù)”會成為一種有前景的趨勢嗎?
施米德休伯:物聯(lián)網(wǎng)的規(guī)模會比人聯(lián)網(wǎng)大得多,因為機器的數(shù)量遠遠多于人類。而且,很多機器的確會向其他機器提供“人工智能服務(wù)”。廣告讓人聯(lián)網(wǎng)具有了商業(yè)化能力,但物聯(lián)網(wǎng)的商業(yè)模式似乎沒有那么明顯。
機器還不能像人一樣學(xué)習(xí),但是快了
有人說,未來屬于無監(jiān)督式學(xué)習(xí),你認同嗎?施米德休伯:我會說,過去也屬于無監(jiān)督式學(xué)習(xí),也就是在沒有老師監(jiān)督的情況下,檢測所觀察現(xiàn)象中的規(guī)律性,這本質(zhì)上就是適應(yīng)性的數(shù)據(jù)壓縮,比如通過預(yù)測編碼。我在25年前發(fā)表了這方面的篇論文——實際上,這篇論文在1991年催生出個可以運行的“極深學(xué)習(xí)程序”,它可以處理數(shù)百個后續(xù)計算層。機器可以像人類那樣學(xué)習(xí)嗎?
施米德休伯:目前還不能,但可能快了。