智能的實現(xiàn)可以另辟蹊徑 人工智能是全新的東西
提起機器人的機械臂,我們通常會想起一些非常笨重的東西,像下面這樣的。
這些機械臂無論是從靈活性還是通用性上都很難稱得上。也很難拿來做一些精細化的活。但孫宇和團隊做出來的機械臂卻能做到很多這種機械臂想都不敢想的事。他們是怎么做到的?
機械臂的力度控制
準確的說,孫宇他們開發(fā)的并不是機器人的硬件,而是機器人智能大腦中的抓取中樞,其具有很高的可擴展性,是可以很方便的嵌入到現(xiàn)有的機器人產(chǎn)品中去的。而目前這個中樞算法已經(jīng)有了很驚艷的表現(xiàn)。
在一個演示視頻里,機械臂順利的將放在桌上的一個燈泡拿了起來,然后擰在了底座上。
可能僅僅在5年前,人們還很難想象機器人能順利完成這樣的工作。這個燈泡被制造出來的時候,估計也想象不到自己會以這樣的方式開始自己發(fā)光發(fā)熱的使命。事實上要做到這一點確實很不容易,尤其是相對于較為成熟的認知手段來說,機械臂的施力控制是更難做到的。
首先把它抓起來就不是一件容易的事了,孫宇表示,自己希望目前的研究將來能使機器人進入在日常生活,為人類提供服務。而目前機器人在日常生活中面對的大挑戰(zhàn)可能就是各種工具的使用了:機器人如果想要用好一樣東西,首先還得保證自己不會把它弄壞了。然后才能談使用的事。因為通常情況下,機械臂“拿起”一樣東西的方法,都是直接將它“握住”,就像這樣:
或許你注意到了,上面的gif和圖片中握住紅球的機械手,都是結構比較簡單的機械手,但是,要讓機器人的手像人一樣靈活,好的辦法難道不是造一個同人類的手一模一樣有許多關節(jié)、可以實現(xiàn)靈活處理的機械手,然后寫出一個精妙的程序來控制它嗎?
事實上機器人界確實早在80年代就流行過高度仿生的多關節(jié)機械手,但是孫宇說,這種結構存在一些明顯的缺陷,比如造價過于昂貴,還有由于其結構非常精細,即使不考慮故障率,也意味著驅動其關節(jié)的電機都無法做得足夠大,因此力量也很受限制,能做的事情可能也很有限。所以,后大家還是普遍傾向于使用結構稍微簡單一些的機械手,這樣一來,不僅成本降下來了,這些機械手確實也能完成要求的任務,看似是理念的倒退,實際上卻有了更好的效果。近隨著技術的發(fā)展,仿生機械手又有所崛起,不過那都是后話了。
孫宇帶領的團隊選擇的是一種只有三根手指的機械手。不過不管幾根手指,當你需要用它來做一件很具體的事情的時候,很明顯只是握住它是不行的。各位可以試著拿起你的手機、端起你的碗、拿起刀來切菜,大家會發(fā)現(xiàn)凡是需要“使用”某樣物體的動作,基本都需要指尖同物體的接觸和施力,而如果讓機器人來做這件事,如何使用工具時施加正確的力,不毀壞工具,又能完成任務就是一件需要考慮一下的事了。
感覺和認知
不過這個問題孫宇和他的團隊倒是老早就解決了,早在09年,孫宇就開發(fā)出了一種讓機械臂能借助機器視覺從人拿一樣東西時手指的反應來判斷物體材質,從而用合適的力去拿起它的技術。能讓機器人在拿起哪怕雞蛋這樣脆弱的物體的時候也不會弄壞它。
這種技術是今天成就的基礎。將雞蛋,或者燈泡穩(wěn)穩(wěn)的握住只是一個靜態(tài)的過程。事實上,只需調(diào)整力度讓機器人將任何物體都輕輕的握住,也能達到上面的效果。但當涉及了具體的操作,機械臂的手指與物體之間的力就不再是簡單不變的一個小值。
就比如說拿這個燈泡的時候,如果你需要把燈泡擰到燈座上去,那你需要考慮的就不止是重力的問題了,當燈泡伸入燈座內(nèi)之后,底座內(nèi)的彈簧和螺紋還會給你帶來一個額外的力,機械臂需要據(jù)此調(diào)整自己握著燈泡的力,才能保證穩(wěn)定的握持。而當機械臂開始旋轉燈泡時,還需要額外的再加一些力。
孫宇說,在機械臂擰燈泡這個過程中,尋找底座并將燈泡的底部與其對準算是相對容易的部分了。因為給予視覺的姿態(tài)估計技術已經(jīng)比較成熟。難點就在于機器對力的理解和調(diào)節(jié)上。當機器收到任務去擰這個燈泡的時候,他就要考慮到擰燈泡的時候可能會遇到什么樣的各種力,然后依此來決定用怎樣的力道和手抓方式來執(zhí)行這個任務了。
當然,孫宇和RPAL的目的遠遠不止是做一個擰燈泡的機器人,正如前面所說的,孫宇希望自己的技術能應用在日常家庭的生活中,具體一點,就是幫助機械手變得更靈活,讓它像人手一樣使用各種物體。孫宇說在日常生活中,即使是拿著同一個東西的時候,做不同的事時也需要用不同的力和姿勢去行動,比如當你拿著一把刀去切面包和去給面包抹黃油的時候,需要施加的力和拿物體的姿勢也是完全不同的,因為當你抹黃油的時候刀片是刀側受力,切面包的時候是刀鋒受力,需要不同的姿勢才能實現(xiàn)這兩個用力的方式。
不過畢竟世界上的“面包”和“燈泡”都是無窮無盡的,你不可能指望機器人拿每種東西之前都要你先去在數(shù)據(jù)庫中添加什么數(shù)據(jù)。“學習”這項能力是非常重要的。之前提到的根據(jù)人手的反應來決定握東西的力度,其實也是一種學習。
為了教給機器人如何使用工具,通過美國自然科學基金的支持,孫宇和團隊建立了一個日常工具使用的數(shù)據(jù)庫,可以記錄之前的每次同物品互動的各種細節(jié),比如力度、姿勢、運動方式。當被要求做新的任務時,機械手就可以根據(jù)之前的數(shù)據(jù),機械手的形狀和物體的形狀來預估一個合適的方式和力度。
深度學習
其實在現(xiàn)在說到機器的學習就不得不提到深度學習,深度學習是目前大熱的研究領域,甚至開始有人懷疑深度學習是不是已經(jīng)對科研界形成了一種不利的壟斷,不過對于這種質疑,孫宇總體還是持一種比較樂觀的態(tài)度。因為深度學習從客觀上來說確實是能產(chǎn)生很好的結果。
因此孫宇和RPAL也將深度學習應用到了他們的系統(tǒng)中,除了之前提到的數(shù)據(jù)庫,目前他們還在開發(fā)一個基于圖機構的機器人的知識系統(tǒng),這個系統(tǒng)的理念是將所有日常生活中的物體都用動作聯(lián)系起來,脫胎于人腦中的鏡像神經(jīng)元(MirrorNeuron),孫宇和RPAL正在建立機器人智能大腦中鏡像神經(jīng)元。
孫宇表示,比如之前舉例的切面包,面包和刀本身是兩個獨立的物體,但是“切”這個動作將這兩者聯(lián)系了起來。同樣“切”這個動作也可以和其它物體聯(lián)系起來。而刀不僅可以通過切這個動作和面包聯(lián)系起來,還可以同菜、水果等物體聯(lián)系起來,同樣,面包也可以通過“裝入容器”這樣的“裝”的動作同碗、袋子等容器聯(lián)系起來,生活中的物品就是這樣通過功能建立起來了一個網(wǎng)絡,它的英文名叫functionalobject-orientednetwork,這樣的一個網(wǎng)絡就可以很方便的被機器人理解,讓它們知道做什么事的時候應該怎樣做。
那如何得到這個網(wǎng)絡呢?孫宇表示,他們目前的網(wǎng)絡建立主要有兩個途徑,一是通過人工手動添加,一是通過讓機器觀看YouTube的視頻自動學習。這其中也用到了深度學習。這個項目由另一項美國自然科學基金資助,已經(jīng)初具規(guī)模。
對于這項技術的終落地,孫宇認為,技術從研究角度來說已經(jīng)成熟了,只是需要一些針對應用和機器人的工程開發(fā),機器人就可以使用鏡像神經(jīng)網(wǎng)絡和抓取中樞來為人類日常生活提供服務。出現(xiàn)在市場上的時間已經(jīng)不會遠了。
人工智能可能是一種全新的東西
我們越來越明顯的發(fā)現(xiàn)這個規(guī)律:至少在現(xiàn)階段,機器人、人工智能的好實現(xiàn)方式并不是對人類的直接模仿,而是對人類的行為、智能等特征進行抽象后,另辟蹊徑的實現(xiàn)。從起源于大腦神經(jīng)網(wǎng)絡的深度神經(jīng)網(wǎng)絡、曾經(jīng)流行但后來被更簡單的機械手取代的高度仿生機械手、到早期“捏雞蛋機器人”通過視覺來實現(xiàn)觸覺的調(diào)整、模仿人腦鏡像神經(jīng)元卻用不同概念替換其中元素的機器人智能大腦鏡像神經(jīng)元,無一不是這樣思維的產(chǎn)物。我們可以把它理解成技術局限下的妥協(xié),但換一個角度講,或許人類確實不應該局限于一味的模仿智能。雖然人工智能中有著“智能”的名字,但這不意味著它就需要以同人類的智能一樣的思路來建造。在那些復雜的電路和元件之下,或許人工智能的形態(tài)會以一種完全超越現(xiàn)在人類想象的形式出現(xiàn)?