【中國智能制造網(wǎng) 名家論壇】近日,2016網(wǎng)易未來科技峰會在北京國貿(mào)大酒店舉行,搜狗CTO楊洪濤進(jìn)行了主題演講——《人工智能里的產(chǎn)品觀》。楊洪濤認(rèn)為:“人工智能本身并不創(chuàng)造價值,使用AI技術(shù)的好產(chǎn)品才創(chuàng)造價值。以場景思考產(chǎn)品,回歸用戶欲望,通過技術(shù)手段解決才有可能產(chǎn)生出好產(chǎn)品。”
“計算力+數(shù)據(jù)+服務(wù)”是三大核心要素
楊洪濤講道,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在應(yīng)用角度的兩大要素如今已經(jīng)較為成熟。一方面是計算力,伴隨著CPU、GPU,以及各種分布式計算和專用計算平臺的發(fā)展,這在一定程度上保障了計算力的提升;另一方面,移動互聯(lián)網(wǎng)的發(fā)展帶來了大量的數(shù)據(jù),而對于互聯(lián)網(wǎng)產(chǎn)品提供商來說,其接觸到的數(shù)以億計的用戶,以及用戶生產(chǎn)的龐大數(shù)據(jù)更是助力人工智能的豐厚資源。
然而當(dāng)談到產(chǎn)品化,要讓“計算力+數(shù)據(jù)”的閉環(huán)做得更好,“服務(wù)”就成了一個不可忽視,且至關(guān)重要的元素。楊洪濤表示:“正是在服務(wù)的使用之中,用戶才產(chǎn)生了數(shù)據(jù),而數(shù)據(jù)又在消耗著計算力,對計算力的發(fā)展提出更高要求,從而為用戶帶來更好地體驗。用戶體驗的提升則逆向推動用戶使用服務(wù),從而產(chǎn)生更多的數(shù)據(jù)。因此,計算力 數(shù)據(jù) 服務(wù)是一個產(chǎn)品迭代的完整循環(huán)。”
他還提到,現(xiàn)在許多公司把目光局限于技術(shù)這一單一領(lǐng)域,他們將自身定位為“一家人工智能公司”或“一家機(jī)器人公司”,卻忽視了對于如何參與這一行業(yè)的深入思考。對于技術(shù)本身的關(guān)注不可或缺,卻不是。
好產(chǎn)品要能生產(chǎn)數(shù)據(jù)來完成自我進(jìn)化
除了關(guān)注AI技術(shù),更重要的是關(guān)注用戶場景。只有在用戶場景背景下,深度思考用戶需求的產(chǎn)品,才能通過“計算力 數(shù)據(jù) 服務(wù)”的閉環(huán),促使用戶使用,生產(chǎn)更多數(shù)據(jù),從而推動技術(shù)產(chǎn)品進(jìn)步——谷歌的GoogleNow以及蘋果Siri的升級與演進(jìn)都是如此。
楊洪濤以搜狗輸入法在語音識別方面的探索經(jīng)驗為例。眾多周知,輸入法只有文本輸入一種方式是遠(yuǎn)遠(yuǎn)不夠的,語音輸入成為搜狗輸入法發(fā)展歷程上亟待解決的一大問題,而在2012年的時候,搜狗還沒有這項技術(shù)。那么搜狗是怎樣解決這一問題的?先是調(diào)用Google國外的中文語音識別接口,為產(chǎn)品提供語音轉(zhuǎn)寫功能,隨后又在用戶使用過程中不斷積攢數(shù)據(jù),并隨著語料規(guī)模的不斷擴(kuò)充,逐步降低語音識別的錯誤率,從2012年40%的錯誤率到如今的4%,其中產(chǎn)品發(fā)展至關(guān)重要的一點就在于是否能產(chǎn)生迭代數(shù)據(jù)的循環(huán)。
基于這一案例,楊洪濤總結(jié):“人工智能本身并不創(chuàng)造價值,使用AI技術(shù)的好產(chǎn)品才創(chuàng)造價值。MIT人工智能實驗室前主管、計算機(jī)科學(xué)家PatrickWinston說過,人工智能就像葡萄干面包里的葡萄干。其實想要吃飽主要還是靠面包,技術(shù)并不等于產(chǎn)品,同時還要去思考產(chǎn)品對用戶的服務(wù)是什么。”
那么什么樣的產(chǎn)品才叫做好產(chǎn)品呢?楊洪濤給出了好產(chǎn)品的三大評判標(biāo)準(zhǔn):叫好、賣座、賺錢。叫好的產(chǎn)品能獲取媒體、投資人的關(guān)注,從而得到更多產(chǎn)品開發(fā)資源;賣座的產(chǎn)品能獲取用戶,展開未來的發(fā)展想象力;賺錢的產(chǎn)品則能直接為企業(yè)發(fā)展贏得利潤。
對用戶欲望的思考要先于技術(shù)手段
有了對于好產(chǎn)品的判斷標(biāo)準(zhǔn)之后又該如何做出一個好產(chǎn)品?楊洪濤指出,需要回到對用戶場景的思考,即需要去考慮是在什么時間什么地點,用戶產(chǎn)生了什么欲望?在用戶欲望產(chǎn)生之后,才是該以怎樣的技術(shù)手段來滿足用戶的欲望。欲望是排在手段之前的,如果顛倒順序,先看自己手里有什么技術(shù)就會犯錯誤。
他再次以搜狗輸入法做語音識別功能為例,解釋了該服務(wù)背后用戶真正的欲望是解放雙手。目前,搜狗語音識別的準(zhǔn)確率已達(dá)到97%,在行業(yè)內(nèi)位列前茅,每日的語音調(diào)用次數(shù)也達(dá)到了1.2億次。但是即便語音識別的準(zhǔn)確率達(dá)到了97%左右也仍舊會產(chǎn)生錯誤,這時用戶要進(jìn)行修改就還需要用手,而這對雙手的解放就是不夠徹底的。搜狗輸入法近期做的新功能“語音修改”,讓用戶用自然語言的形式進(jìn)行文字糾錯,就是出于這一對使用場景的思考。
這一場景的數(shù)據(jù)還可以延伸到更多服務(wù):比如當(dāng)用戶開車時,是不方便輸入文字的。而通過語音的方式可以讓用戶在地圖產(chǎn)品中用語音進(jìn)行修改,比如說出“是歡度佳節(jié)的佳”就可以把導(dǎo)航目標(biāo)從“世紀(jì)嘉園”修正成“世紀(jì)佳園”。
這一功能是符合前面提到的數(shù)據(jù)生成和解決用戶欲望的觀點的。“要修改錯誤,首先需要知道用戶的錯誤發(fā)生在什么地方,其次要了解用戶是怎樣認(rèn)知和描述這一錯誤的。這兩類數(shù)據(jù)對輸入法和語音識別未來的改進(jìn)都有相當(dāng)?shù)拇龠M(jìn)作用。”楊洪濤總結(jié)道。
AI服務(wù)的本質(zhì)是“自然交互”和“知識索引”
對此楊洪濤以開車用戶的需求為例進(jìn)行了詳細(xì)的解釋。傳統(tǒng)意義上,導(dǎo)航僅僅解決了“如何從a地前往b地”的問題,而當(dāng)回歸對于用戶欲望的思考時就會發(fā)現(xiàn)在使用導(dǎo)航時,用戶并不只是為了前往B地,其真正的意圖在于“去B地做什么”。比如一個人要去機(jī)場,這個人是要去哪個航站樓?到底是去出發(fā)層還是到達(dá)層?航班的情況如何?什么時間到合適?這些問題都是用戶潛在需要考慮的。因此需要對導(dǎo)航背后意圖數(shù)據(jù)做足夠的分析,把首都機(jī)場分為T1、T2、T3航站樓,導(dǎo)入所有的航班信息,當(dāng)用戶給出航班號便可以得知航班的情況,對應(yīng)出發(fā)和到達(dá),并給出出發(fā)時間建議,把這些和語義技術(shù)結(jié)合在一起做出更好的服務(wù)。
他指出AI服務(wù)的本質(zhì)包含兩方面,是自然交互的技術(shù),包括圖像及語音,第二是知識的索引。他坦言,搜狗目前也在這兩方面做出了巨大的努力:一方面在自然交互上,搜狗通過用戶產(chǎn)生的大量數(shù)據(jù)不斷完善語音識別、語義理解技術(shù);另一方面,搜狗搜索也在做大量的知識索引,包括與微信、知乎的內(nèi)容引入,明醫(yī)搜索以及微軟必應(yīng)的合作等。今年4月,搜狗還向清華大學(xué)捐贈1.8億人民幣,成立了天工智能計算研究院,相關(guān)研究成果也將應(yīng)用于搜狗下一代產(chǎn)品中。
在他看來,搜索引擎公司是人工智能基因足的模式,天生就是大數(shù)據(jù)產(chǎn)品,容易獲得用戶交互的行為,所以數(shù)據(jù)本身對于推動整個人工智能研究會有巨大的幫助。只有把人工智能技術(shù)與領(lǐng)域的知識結(jié)合得足夠好,才能夠真正的在場景下解決好用戶的需求欲望。