【
中國智能制造網(wǎng) 技術(shù)前沿】我們發(fā)現(xiàn),機(jī)器人現(xiàn)在需要有一個根本性的進(jìn)化,這就是逐漸從性進(jìn)入到了靈巧性。新的應(yīng)用需求要處理不確定性,處理不完全信息,具體表現(xiàn)為非結(jié)構(gòu)化環(huán)境,這些需求和現(xiàn)有技術(shù)比較還是有一點(diǎn)差距的。
陳小平教授曾任2015年世界人工智能大會機(jī)器人領(lǐng)域主席,2008年、2015年兩年的機(jī)器人世界杯及學(xué)術(shù)大會主席。在2016年獲得IEEE ROBIO大會佳論文獎,同時(shí)還獲得了國務(wù)院政府特殊津貼,是中科大杰出研究校長獎獲得者。
陳小平教授從性和靈巧性兩個方面深入分析了機(jī)器人過去取得的成就,及將來面臨的挑戰(zhàn)。以下是陳教授在機(jī)器人大講堂的演講實(shí)錄(為使文章簡介規(guī)范,略有改動):
機(jī)器人靈巧性:需求推動的技術(shù)變革
機(jī)器人從性向靈巧性轉(zhuǎn)變
對于機(jī)器人的發(fā)展,我們一方面結(jié)合國家戰(zhàn)略需求和市場的需求研發(fā)機(jī)器人;另一方面,根據(jù)我們了解的機(jī)器人技術(shù)都取得了什么樣的成果,能夠支撐什么樣的應(yīng)用,來衡量技術(shù)的有效性。當(dāng)把兩個方面放在一起時(shí),我們發(fā)現(xiàn),機(jī)器人現(xiàn)在需要有一個根本性的進(jìn)化,這就是逐漸從性進(jìn)入到了靈巧性。
回顧一下機(jī)器人產(chǎn)業(yè)的歷史。1961在通用汽車生產(chǎn)線上用了工業(yè)機(jī)器人,到現(xiàn)在56年了。人工智能領(lǐng)域到現(xiàn)在已經(jīng)做了60多年,取得的成果國內(nèi)比較關(guān)注的是阿爾法狗,但西方民眾開始重視人工智能是在1997年,當(dāng)時(shí)IBM的深藍(lán)戰(zhàn)勝了十年棋王卡斯特羅夫。
所以,對西方人來說,他們感受到人工智能超過人的時(shí)間比我們早20年。但是為什么工業(yè)機(jī)器人能夠成功,而所謂的智能機(jī)器人到現(xiàn)在還不成功?
工業(yè)機(jī)器人回顧
其實(shí)工業(yè)機(jī)器人是比較簡單的,其硬件本體基于關(guān)節(jié)-連桿機(jī)構(gòu),用運(yùn)動學(xué)來計(jì)算關(guān)節(jié)的角度,保證機(jī)械臂的末端能夠達(dá)到指定的位置。這很容易給人帶來一個誤區(qū),覺得機(jī)器人的成功完全是因?yàn)闄C(jī)械臂的性,其實(shí)不是這樣的。
近幾年我們到很多生產(chǎn)現(xiàn)場去實(shí)地學(xué)習(xí),發(fā)現(xiàn)生產(chǎn)線上還需要大量輔助設(shè)備,其中一種叫夾具。夾具相對于機(jī)器人來說古老得多,這個領(lǐng)域有很多成熟的技術(shù)。一般來說,在國內(nèi),一條生產(chǎn)線只有1/3到1/5的開支是機(jī)械臂的,其它的都是這些輔助設(shè)備的,包括夾具的。
在國外,他們的加工精度更高,所以他們輔助裝備的開支占比更大,只有1/5到1/8是機(jī)械臂,其它都是輔助設(shè)備的。我們這樣全面的一看才發(fā)現(xiàn):工業(yè)機(jī)器人能夠成功,并不是單純的因?yàn)闄C(jī)械臂的性,還要加上環(huán)境的性。
環(huán)境怎么能?必需經(jīng)過化改造,也就是說造一條生產(chǎn)線,以保證生產(chǎn)線上的每一個操作對象(如工件)在任何時(shí)刻都被定位,使得機(jī)械臂和其他加工設(shè)備可以地進(jìn)行操作。這才是工業(yè)機(jī)器人的一個完整圖像。
傳統(tǒng)主流控制策略
工業(yè)機(jī)器人背后的技術(shù)主要是控制技術(shù)。傳統(tǒng)的主流控制技術(shù)有四種:優(yōu)化控制、適應(yīng)性控制、Robust控制,這三種都試圖讓機(jī)器人有一定的靈活性或者靈巧性,第四種叫分層控制。當(dāng)問題太復(fù)雜了,就需要分層控制了。
各種傳統(tǒng)控制策略背后的原理,其實(shí)就兩種。
種是基于決策論的控制,也就是基于馬爾可夫決策過程理論的控制原理。這種原理對問題做了一個抽象,把實(shí)際問題抽象為狀態(tài)集、行動集、回報(bào)函數(shù)和概率轉(zhuǎn)移函數(shù)四個基本構(gòu)件。在這套基本構(gòu)件的基礎(chǔ)上,引入一些數(shù)學(xué)規(guī)劃的方法。首先定義值函數(shù),值函數(shù)是評價(jià)一個動作的價(jià)值的。
值函數(shù)怎么計(jì)算?原始的辦法是用貝爾曼公式,后來有很多種改進(jìn)的計(jì)算辦法。有了值函數(shù),就可以計(jì)算優(yōu)策略,從而決定在什么狀態(tài)下執(zhí)行什么策略好。決策論的一個基本要素是概率轉(zhuǎn)移函數(shù),概率轉(zhuǎn)移函數(shù)在馬爾可夫決策里扮演了關(guān)鍵性的角色,后面的值函數(shù)和優(yōu)策略求解,都依靠概率轉(zhuǎn)移函數(shù),沒有它后面的事情都干不了。
這套體系在理論上有很多成果,但在實(shí)際應(yīng)用中,根據(jù)我們的觀察和了解,得到一個大規(guī)模實(shí)際問題的可實(shí)用的概率轉(zhuǎn)移函數(shù)是非常困難的,鮮見成功實(shí)例。也就是說,這套理論假定了一種數(shù)學(xué)機(jī)制,但那個機(jī)制在大規(guī)模實(shí)際問題中通常是得不到的。
那么,工業(yè)機(jī)器人實(shí)際上是怎么干的?就是用運(yùn)動學(xué)和動力學(xué)來簡化決策論模型,關(guān)鍵是把概率轉(zhuǎn)移函數(shù)給取代了,這樣就沒問題了。這樣做的效果是達(dá)到了性,但很大程度上喪失了靈巧性,因?yàn)樵隈R氏決策論體系中,沒有概率就無法表達(dá)不確定性。因此,在工業(yè)上實(shí)際我們用的是運(yùn)動學(xué)、動力學(xué)這套辦法。
還有一種是基于模糊數(shù)學(xué)的模糊控制。模糊數(shù)學(xué)也可以用一段話來概括,核心思想是用實(shí)數(shù)區(qū)間[0,1],即用連續(xù)統(tǒng)上的分類/建模替代二值布爾分類/建模。比如講臺邊緣能測量嗎?不能。那么按照模糊數(shù)學(xué),對桌面邊緣上的每一點(diǎn),給它一個隸屬度。
比如給它1,表示這一點(diǎn)肯定在桌面上;給它0,肯定不在桌面上;其他情況,用隸屬度大小表示在桌面上的模糊度。隸屬度和馬氏決策論中的概率轉(zhuǎn)移函數(shù)一樣,對于大規(guī)模實(shí)際問題很難得到實(shí)用化的隸屬度。
1997年,IBM的深藍(lán)打敗了卡斯帕羅夫,當(dāng)時(shí)西方人和我們看到阿爾法狗打敗李世石是一樣的,感覺天都塌了。深藍(lán)的核心技術(shù)是前瞻至少14步,對前瞻得到的棋局用專家的知識做判斷,選擇有利的走步。這么簡單的辦法計(jì)算量非常大,所以用了人工智能的一種技術(shù)叫剪枝,把前瞻棋局減到了600億個,但還是算不過來。
人工智能硬件什么時(shí)候開始做?深藍(lán)就開始做了,不是現(xiàn)在才做。許峰雄做了專用的芯片,計(jì)算象棋棋局的評價(jià),一秒鐘算5億個棋局,600億個棋局5分鐘就算完了,可以用于比賽實(shí)戰(zhàn)。這套技術(shù)看上去很簡單,但是意義非常重大,我把它的意義總結(jié)為“許峰雄不等式”: