幸運(yùn)而又不幸,筆者從事人工智能研究時(shí),正是此領(lǐng)域最低潮的那幾年。今天的人工智能不僅鳥槍換炮,還在嚴(yán)肅地討論統(tǒng)治全人類的問題。學(xué)術(shù)界和工業(yè)界諸仁波切們認(rèn)為人工智能要接管世界,攏共分三步:
第一步,是感知智能;
第二步,是認(rèn)知智能;
第三步,也是決定性的一步,是通用智能。
先討論一下,機(jī)器與智能的未來方向到底是為了替代人類,還是幫助人類。我個(gè)人的觀點(diǎn),一半是海水,一半是火焰,這兩個(gè)方向是并存的。
宏觀上來看,機(jī)器替代人類不但不是科幻,而且早就進(jìn)展多年了。替代人類,不是說機(jī)器拿起彈弓,把人類一個(gè)個(gè)都崩了,而是說工業(yè)革命以來機(jī)器生產(chǎn)效率的提升,已經(jīng)使得人類的出生率自適應(yīng)地下降了很多。這個(gè)趨勢還將繼續(xù)發(fā)展,人類作為一個(gè)群體在數(shù)量上的萎縮是不可逆轉(zhuǎn)的。
微觀上來看,機(jī)器則實(shí)實(shí)在在地幫助著人類,你開的車、用的手機(jī),都在幫助人類朝著好吃懶做的共產(chǎn)主義終極理想前進(jìn)。在“更快、更高、更強(qiáng)”這類物理能力上,機(jī)器早已甩開人類幾個(gè)數(shù)量級了。
人工智能的發(fā)展,就是希望機(jī)器在“更聰明”這個(gè)點(diǎn)上也能超過人類、幫助人類。從這個(gè)點(diǎn)出發(fā)點(diǎn)來看,人工智能要跨過幾個(gè)大的關(guān)隘。
從五十年前人工智能學(xué)科誕生起,研究者們就希望機(jī)器能夠替代人的五官,像人一樣去聽去看,這就是感知智能。機(jī)器像人耳一樣把音波變成音素,就是語音識別任務(wù);機(jī)器像眼睛一樣辨識圖像中的物體,就是計(jì)算機(jī)視覺任務(wù)。當(dāng)然,感知智能不一定是簡單地模仿人,在某些人類束手無策的問題上,比方說指紋識別和虹膜識別,機(jī)器輕松就能彎道超車。
深度學(xué)習(xí)技術(shù)成熟之前,感知智能里只有人臉檢測、虹膜識別等一些局部的小問題,解決得比較徹底。更多的泛場景問題,特別是語音識別、計(jì)算機(jī)視覺等,始終停留在實(shí)驗(yàn)室的研究階段。直到本世紀(jì),深度學(xué)習(xí)技術(shù)的突破,使得機(jī)器能夠用復(fù)雜的模型從海量的數(shù)據(jù)里充分攫取信息。這與小孩子看一次狗就能認(rèn)識狗,從原理上大不相同。
關(guān)于“人類看一次狗就能認(rèn)出狗”這一觀點(diǎn),有人是不服的,他們對我說:“小孩子與狗的那一回眸,已經(jīng)從各個(gè)角度采了無數(shù)采樣,積累了很多的樣本。”這并不符合事實(shí):我特意觀察過我的兩個(gè)孩子,他們在圖畫書上以平面方式見過一次的動(dòng)物,到了動(dòng)物園還是輕松就認(rèn)出來了。所以啊,不要以為機(jī)器智能的進(jìn)化是把人類走出非洲的大片兒回放一遍,他們走的根本就是不同的路,而且是我們無法預(yù)測的路。
感知智能只是實(shí)現(xiàn)了一些動(dòng)物本能,為了象一名真正的靈長目戰(zhàn)士那樣去戰(zhàn)斗,機(jī)器就要完成一些簡單的智力勞動(dòng),比如自然語言理解、翻譯、對話等。這類問題,就是認(rèn)知智能問題。
認(rèn)知智能要解決的是讓機(jī)器掌握初級理解和思考的能力。其中的挑戰(zhàn)比感知智能要大得多了,主要原因就是語言、知識等理解過程中需要建模的對象,復(fù)雜程度或狀態(tài)空間的規(guī)模非常龐大。
具備了感知和認(rèn)知智能的機(jī)器,基本上就達(dá)到了高級靈長目動(dòng)物的水準(zhǔn),當(dāng)然在記憶和計(jì)算能力上則早已秒殺人類?;氐轿恼麻_頭的問題,下一個(gè)階段就可以追求“通用智能”,接管全人類智力活動(dòng)了么?所謂通用智能,就是說同一個(gè)人工智能體不僅能下棋或翻譯,而是個(gè)無不知百行通的多面手。
我的觀點(diǎn)是,在通用智能之前,先要解決“決策智能”這類問題。什么是決策智能呢?大家可以想象每部評書里都離不開的角色——軍師。與大量僅僅具備感知智能的赳赳武夫和少量具備了認(rèn)知智能的文書、中軍是不同,軍師的Job Description,往往是這樣的:
1.熟練掌握琴棋書畫等一項(xiàng)以上奇技淫巧。
2.善聽人言,能聞獸語。
3.進(jìn)士以上學(xué)歷,有三年以上算命或其他相關(guān)行騙經(jīng)驗(yàn)。
4.有極腹黑的心理素質(zhì),和泰山壓頂腰不直的抗辱罵能力。
5.能設(shè)計(jì)和推進(jìn)公司內(nèi)犬牙交錯(cuò)、互相制衡的人事制度。
6.全面掌握對外與天斗、與地斗、與人斗的工作,精通瞞天過海、借刀殺人、走為上等多項(xiàng)計(jì)謀的制定和實(shí)施。
逐一審視這些要求,我們發(fā)現(xiàn)具備了感知智能和認(rèn)知智能,1、2、3都不是問題;4更是機(jī)器的天然優(yōu)勢;而5、6兩條,就不那么簡單了。愚見認(rèn)為,這才是人工智能未來最需要向人類伸出援手之處,姑且稱其為決策智能——畢竟用機(jī)器做速記或翻譯,不過是效率的提高,更加會加速人類的滅亡。區(qū)別于機(jī)器蟑螂和智能猿猴,決策智能有哪些不一樣挑戰(zhàn)呢?
一、博弈性的場景。當(dāng)你的環(huán)境本身受到你的決策影響時(shí),這就是一個(gè)博弈性的問題。往小了說是打牌、下棋,往大了說是戰(zhàn)爭、談判等,僅僅靠靜態(tài)的建模方法是無法處理這些博弈性問題的。
二、非明確的反饋。這里面有兩種場景:一種是很多次決策才能對應(yīng)一次明確的結(jié)果,比方說炸金花,十幾輪的出牌以后才有一個(gè)確定的輸贏;另一種是結(jié)果本身就是概率性的,比方說廣告的決策,即使是確定了同一個(gè)用戶,同一個(gè)素材,同一個(gè)場景,用戶點(diǎn)擊還是不點(diǎn)擊仍然是隨機(jī)的,只能從概率意義上判斷準(zhǔn)確性。
有人的地方就有江湖。只要人與人之間發(fā)生交互,就有決策智能的用武之地?;ヂ?lián)網(wǎng)的大發(fā)展,為我們帶來了大量鮮活的這類問題。目前的深度學(xué)習(xí)框架,在解決這類問題上效果并沒有十分突出,這里面有些深層次的原因,篇幅所限就不展開了,以后有機(jī)會專門寫文章說說我的觀點(diǎn)
當(dāng)然,我是站著說話時(shí)不腰疼的,趁著腰還不疼,我要懇請人工智能界諸仁波切們在接管全人類之前賞下眼神來,認(rèn)真思考下在博弈場景和非明確反饋情形下的決策智能問題該用什么新框架解決,因?yàn)檫@太有意義了,也太有意思了。
更多信息請關(guān)注微信公眾號: “OK智能制造” 請掃描下方二維碼并加關(guān)注!