大家下午好,我的名字叫金榕。可能大家都知道,大部分阿里的員工都有花名,是吧?但是金榕是我的真名不是花名。我是2014年加入阿里的,我原先是在美國密歇根州工作了十幾年,實際上我在阿里做的工作主要是數(shù)據(jù)、智能、機器學(xué)習(xí)的事情。我們主要的產(chǎn)品是在淘寶上的個性化搜索和個性化推薦,大家如果對淘寶推薦和搜索產(chǎn)品有任何建議,歡迎跟我聯(lián)系。
今天我想說的話題,是數(shù)據(jù)和智能之間的關(guān)系。我們先看一個例子,就是汽車自動駕駛這件事情,現(xiàn)在自動駕駛已經(jīng)被炒得非常熱了,從Google早開始推出智能駕駛的車,實際上在內(nèi)華達(dá)州已經(jīng)有了制造,到很多車廠都已經(jīng)開始做自動駕駛這件事情??赡芎苌偃酥溃@件事情也是一個非常老的話題,1994年的美國的卡內(nèi)基梅隆大學(xué)有一個項目-AlvinProject,目的就是要做一個自動駕駛的車,1994年已經(jīng)很成功的把一個車從東海岸開到西海岸,基本上是自動駕駛的,以每小時120公里的速度開。對我來講,一個很有意思的問題,我想大家也會問,這樣一個20年前就已經(jīng)比較成型的技術(shù),為什么到現(xiàn)在真正的商業(yè)化才開始呢?對吧?當(dāng)然這個除了商業(yè)化的原因以外,實際上一個非常重要的原因是什么?就是數(shù)據(jù)的問題。
早期在做自動駕駛的時候,實際上收集的數(shù)據(jù)是非常少的,基本上只有幾十個小時的駕駛數(shù)據(jù),對復(fù)雜路況的處理能力比現(xiàn)在低很多,從安全性上講是不夠的。這就造成了為什么這樣一個技術(shù)在20年前已經(jīng)相當(dāng)成熟了,但是到今天大家才真正給它商業(yè)化、規(guī)?;?,其中一個很大的原因是由于Google或者說其他的車廠有非常大的能力收集幾十萬小時的駕駛信息,而且有非常大的處理數(shù)據(jù)能力,能夠把所有的信息抽出來,能讓車在非常復(fù)雜的情況下有一個很好的處理能力。從這個意義上來講,大的數(shù)據(jù)真的是很重要的。
另外一個是AlphaGo,大家現(xiàn)在都知道Google做一個能夠下圍棋的機器人,可以自動去讀棋譜能夠跟的圍棋選手下,而且一直保持非常好的勝率。但是同樣,大家也知道下棋這件事情不是今天才發(fā)生,很早年前IBM的DeepBlue(深藍(lán))是非常成功的例子,他制作了一套系統(tǒng)能夠跟好的象棋大師做對弈。我也想提一下,所有Google在AlphaGo里面做的系統(tǒng),包括深度學(xué)習(xí)、強化學(xué)習(xí)這件事情,實際上在20年前就已經(jīng)被人在游戲上應(yīng)用了。在1996年的時候,我估計現(xiàn)場有些同學(xué)可能都還沒出生,那時候有一個系統(tǒng)叫TD(λ)的算法,有幾位科學(xué)家把這個算法應(yīng)用在一個在美國挺流行的游戲上,很快成為了世界。
這里頭神奇的地方,跟AlphaGo比起來的話,AlphaGo還需要讀人類棋手的棋譜,從中吸取經(jīng)驗成長成為世界的選手,但是對于我剛才說的TD(λ)的算法來講,當(dāng)時就是做了兩個不同版本的算法,這兩個版本自己跟自己下了150萬盤,就成了世界。某種意義上講,真的是自學(xué)成才的算法。
那么說回來,為什么說這樣一套AlphaGo的系統(tǒng)大部分的核心技術(shù)點,實際上在20年前都已經(jīng)很成熟,為什么到今天大家才把它的面紗揭開來呢?關(guān)鍵還是數(shù)據(jù)的問題,20年前我們的計算機不足以處理這么多的數(shù)據(jù),現(xiàn)在我們有了GPU可以非常有效的處理這些數(shù)據(jù)。