【中國智能制造網(wǎng) 行業(yè)動態(tài)】當(dāng)前人機(jī)交互的實質(zhì),實際上是人把腦子搬過去了,從嘴巴到耳朵,從耳朵又出來,其實這就是典型的數(shù)據(jù)喂出來的結(jié)果。
人工智能獨立難行 大數(shù)據(jù)為重要突破口
本文為清華大學(xué)人工智能國家重點實驗室主任朱小燕在海云數(shù)據(jù)“新能力、新服務(wù)、新共享”發(fā)布會上的演講,發(fā)布于海云數(shù)據(jù),經(jīng)億歐編輯,供行業(yè)人士參考。
今天我從人工智能的角度跟大家分享一下關(guān)于人工智能和大數(shù)據(jù)的一些信息。
這是Gartner的數(shù)據(jù),圖上有兩條線,藍(lán)線是一般的技術(shù)發(fā)展曲線,紅色是人工智能技術(shù)發(fā)展曲線,實際上人工智能就是這樣一個跌宕起伏的學(xué)科,現(xiàn)在其實到了第三次高峰這個地方。人工智能跟太多的東西相關(guān),不能獨立先行。
在這次高峰中大數(shù)據(jù)的功勞我想大家都是知道的,它其實為機(jī)器學(xué)習(xí)提供了糧食,為分析決策提供了依據(jù)。到2012年人工智能開始被很多人接受和學(xué)習(xí)了,也得到了很廣的應(yīng)用,在語音、視覺等等領(lǐng)域得到了充分的肯定。再到了去年,一系列平臺都發(fā)布了,這個時候深度學(xué)習(xí)的模型和算法就更加普及,在更多的地方開花結(jié)果。
1、大數(shù)據(jù)+人工智能落地案例
個是圖象處理,即數(shù)據(jù)+決策算法。這是今年2017年的競賽我們的參賽作品,是一個胸片,可以認(rèn)為是CT的或者核磁共振的,實現(xiàn)了80%的精度。憑借它,我們的團(tuán)隊拿到了名。
接下來是機(jī)器翻譯概念圖,它是雙語語料+深度學(xué)習(xí)的應(yīng)用,是文字應(yīng)用中的通用算法。它用大量的雙語語料訓(xùn)練一個模型,然后得到了一個大模型,效果就是這張圖,靠右邊是人的結(jié)果,剩下是模型的結(jié)果,可以看到準(zhǔn)確率是相當(dāng)高的。
第三個是媒體大數(shù)據(jù)+自然語言處理。我們社交媒體的數(shù)據(jù)其實是非常多的,社交媒體數(shù)據(jù)改變了我們所有人。這是一個典型的案例,它把社交媒體上關(guān)于演員“馬麗”的評價進(jìn)行抓取,然后經(jīng)過各種各樣的計算給出評價,這就是人工智能和自然語言處理合作的表現(xiàn)。
2、人工智能如何落地?關(guān)鍵是場景、產(chǎn)品和技術(shù)
人工智能落地應(yīng)用重要的是場景、產(chǎn)品和技術(shù)。其實場景是關(guān)鍵,比如說海云剛才發(fā)布的公安這個場景,在這個場景下我們怎么發(fā)揮技術(shù)的特長。產(chǎn)品是導(dǎo)向,即便是同一個公安的,可能還需要不同的能力,比如說攝像頭的人臉分析。后是技術(shù)的支撐,你要了解哪些技術(shù)有哪些支撐,在哪些場景下發(fā)揮大的能力,這樣才能把人工智能更好地落地融入產(chǎn)品,使我們的產(chǎn)品帶有智能的元素。
3、大數(shù)據(jù)需要被凝練成知識
現(xiàn)在信息量如此之大,但其實我們有很多找不到有用知識的情況。有一本書里說“只有20%的數(shù)據(jù)是干凈的,80%的數(shù)據(jù)都是不干凈的”。而在這個信息里面有價值、有意義的其實只有1%,我們稱它叫做知識。
我們說大數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)、挖掘分析等等,其實數(shù)據(jù)是什么?它應(yīng)該凝練到知識。如果不能很好地把它凝練、總結(jié)、歸納就不能再利用,也不能保證系統(tǒng)的可靠性、可遷移性、可擴(kuò)展性。如果你做的東西不精煉,再遷移的時候就要重來,不能把有效的同等的東西都遷移過去就要重來,這就有效率的問題,還有不能保證人機(jī)協(xié)同。
4、人工智能目前仍處在人機(jī)協(xié)同階段
我們現(xiàn)在講的人工智能它是一個理想狀態(tài)的人工智能,像電影一樣的。但是現(xiàn)今我們至少在學(xué)術(shù)界有一個很好的共識,我們現(xiàn)在其實是人機(jī)協(xié)同的階段,我們不是讓機(jī)器代替人,而是讓機(jī)器協(xié)助我們。
當(dāng)前人機(jī)交互的實質(zhì),實際上是人把腦子搬過去了,從嘴巴到耳朵,從耳朵又出來,其實這就是典型的數(shù)據(jù)喂出來的結(jié)果。
這樣條件下產(chǎn)生的模型可不可以用呢?可以用,在某些場合、某些場景下是可以用的,而且可能比較好用。但是,如果讓它在所有的地方,或者大部分地方都用,那么我們需要這樣的系統(tǒng):經(jīng)過知識加工再反饋給你,這就是為什么要經(jīng)過知識加工以后才能夠做到真正的人工智能,這個的提升空間還很大。
但是我們希望有一個這樣的交互平臺,我們叫做知識平臺,或者是剛才說的AI學(xué)習(xí)平臺,甚至可以說是企業(yè)大腦。知識生產(chǎn)平臺化,知識表示模塊化,知識管理可視化,知識更新自動化。只有在這樣的一種情況下,我們才能更好地運用知識管理信息。
5、關(guān)鍵點:數(shù)據(jù)可視分析
如果處理數(shù)據(jù),首先我們可以用數(shù)據(jù)挖掘找出有用的東西。然后數(shù)據(jù)分析,把挖掘出的數(shù)據(jù)分析出價值。這里面可視分析起到一個輸出價值的作用,因為做不好可視分析的話,大部分人不知道你干了什么,也不知道你干的這件事我能用來干什么。可視分析是人機(jī)交互非常重要的方式。比如說剛才的語義查詢可以很快地帶著用戶進(jìn)入場景、進(jìn)入角色,可以很快地和系統(tǒng)進(jìn)行交互,得到我們想要的東西。
(原標(biāo)題:AI獨立難行,或許可以這樣試試 系清華大學(xué)人工智能國家重點實驗室主任朱小燕演講 億歐編輯)