?
本文作者付曉萌,三節(jié)課新媒體運(yùn)營喵。
?
5小時的對弈后,世界第一柯潔惜敗。
今天下午,浙江烏鎮(zhèn)舉行了“人機(jī)終極對決”的第一局,世界排名第一的中國圍棋選手柯潔,以四分之一子輸給了 Google 旗下的人工智能程序 AlphaGo 。各家媒體第一時間紛紛報道此事,我們?yōu)榇蠹艺×瞬糠置襟w的精彩觀點(diǎn),與你共享。
?
一、更強(qiáng)的 AlphaGo
?
本次和柯潔對決的并不是一年前和李世石對決的 AlphaGo 了,而是升級版的 AlphaGo 。據(jù)DeepMind 的創(chuàng)始人 Demis Hassabis 透露,當(dāng)前AlphaGo版本比跟李世石下棋的版本快10倍,硬件方面利用的谷歌自主研發(fā)的TPU,之后還會公布該版本AlphaGo更多的技術(shù)細(xì)節(jié)。
?
去年和李世石對決的 AlphaGo 是巧妙地混合了三種算法:蒙特卡洛樹搜索+監(jiān)督學(xué)習(xí)+增強(qiáng)學(xué)習(xí)。
簡單介紹
蒙特卡洛樹搜索:通過值網(wǎng)絡(luò)來評估大量選點(diǎn),并通過策略網(wǎng)絡(luò)選擇落點(diǎn);
監(jiān)督學(xué)習(xí):通過學(xué)習(xí)3000萬步人類棋譜,對六段以上職業(yè)棋手走棋規(guī)律進(jìn)行模仿;
增強(qiáng)學(xué)習(xí):兩臺AlphaGo從自我對戰(zhàn)中學(xué)習(xí)如何下棋。
?
搜狗公司CEO@王小川?在知乎上根據(jù)公開資料,推測了此次AlphaGo2.0 與AlphaGo1.0 在技術(shù)原理上的不同之處:
1. 放棄了監(jiān)督學(xué)習(xí),沒有再用人的3000萬局棋譜進(jìn)行訓(xùn)練。這本是AlphaGo最亮眼的算法,也是今天主流機(jī)器學(xué)習(xí)不可避免的核心條件:依賴于優(yōu)質(zhì)的數(shù)據(jù),在這個特定問題下就這么被再次突破了。
2. 放棄了蒙特卡洛樹搜索,不再進(jìn)行暴力計算。理論上,算法越笨,就越需要暴力計算做補(bǔ)充。算法越聰明,就可以大大減少暴力計算。從AlphaGo 2.0的“馬甲”Master的歷史行為看,走棋非常迅速,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力的計算。
3. 極大地強(qiáng)化了增強(qiáng)學(xué)習(xí)的作用,之前敲邊鼓的算法,正式成為扛把子主力。想想看有多勵志:兩臺白癡機(jī)器,遵守走棋和獲勝規(guī)則,從隨機(jī)走棋開始日夜切磋,總結(jié)經(jīng)驗,不斷批評和自我批評,一周后終成大器。
?
@王小川?猜測,AlphaGo 2.0對計算資源開銷極小,把當(dāng)前棋局輸入神經(jīng)網(wǎng)絡(luò),電流流過,輸出就是最佳的走棋方案。如此算法下,有可能僅僅依靠一個GPU工作,每一步棋消耗的能源接近人的大腦。
也就是說,此次柯潔所面對的,是更強(qiáng)、更難應(yīng)對的 AlphaGo 。
在@愛范兒?今日第一時間推送的《柯潔輸了!人不是那個人,「狗」更不是那個「狗」》一文中,作者@李帥飛&常巖?也指出了AlphaGo2.0 的駭人之處:
它已經(jīng)跳出了學(xué)習(xí)人類棋盤的方法,而進(jìn)入了自己左右手互搏,自己學(xué)習(xí)各種情況的局面,一方面它所學(xué)習(xí)到的棋局廣度非人類可想象,另一方面它的出招可能越來越?jīng)]有“套路”可言。更別提 AlphaGo 只要有電就可以無休止學(xué)習(xí)這件事了,由于圍棋本身有明確的規(guī)則判斷勝負(fù),所以 AlphaGo 可以在無需人類標(biāo)注的情況下就能判斷自己出招的好壞,更是強(qiáng)化學(xué)習(xí)的一大優(yōu)勢。
?
意思很明顯,現(xiàn)在的「狗」,是人類智慧和機(jī)器智慧的結(jié)合體了。
?
二、勝負(fù)既已定,為何還要繼續(xù)?
?
比賽開始前,很多媒體和網(wǎng)友都對這場比賽做過預(yù)測,認(rèn)為升級后的 AlphaGo 恐將完勝柯潔??聺嵲谧蛲碜约旱奈⒉╅L文《最后的對決》中也有說到,現(xiàn)在的AI進(jìn)步之快遠(yuǎn)超我們的想象......我相信未來是屬于人工智能的。
?
?
李開復(fù)曾預(yù)料:人類的勝算恐怕為零,勝負(fù)已經(jīng)意義不大了。
棋圣聶衛(wèi)平也表示:我預(yù)測結(jié)果是 0 比 3,AlphaGo 勝出。
?
明知勝負(fù)已定,那為何人機(jī)對抗還要繼續(xù)下去呢?《柯潔輸了!人不是那個人,「狗」更不是那個「狗」》就引用了《智能革命》一文中李彥宏的說法:
2017 年初,AlphaGo 的變身 Master 橫掃中韓頂級高手,一時間人們分化為悲觀派、降臨派、冷靜派、腦洞派……我們希望有更多人是默默學(xué)習(xí)派。
?
并認(rèn)為,進(jìn)行 AI 與人類的對抗,根本目的還是檢驗和優(yōu)化算法,并且力爭在其他更有價值的行業(yè)中進(jìn)行應(yīng)用:
從最初的 AlphaGo,到 Master,再到今天的 AlphaGo,三代產(chǎn)品,三段歷程,對應(yīng)的恰好是“理論,實驗,再創(chuàng)新”的三段論。
而這種基于互聯(lián)網(wǎng)大數(shù)據(jù)的深度學(xué)習(xí)和決策支持系統(tǒng),將在很多人類算力不可及的領(lǐng)域提供支撐。
?
文中也提到了 Google 大中華區(qū)總裁石博盟所透露的:AlphaGo 的第一個結(jié)合點(diǎn)會是醫(yī)療領(lǐng)域,AI 將在一定準(zhǔn)確率的情況下,給予醫(yī)生診療判定方面的輔助,對于糖尿病、癌癥等疾病的治療和研究大有裨益。
而未來在更大的深度和廣度上,AlphaGo 積累的決策模型,將逐漸把人力從需要反復(fù)的勞動中解放出來,同時對腦力勞動進(jìn)行反哺,對絕大多數(shù)社會元素進(jìn)行快速解構(gòu)并解讀,再反饋給人類。
如同去年大熱的科幻片《降臨》一樣,人工智能與人類本體,終將會找到一條智慧結(jié)合的發(fā)展大路。
?
三、對決的意義
?
去年李世石與AlphaGo的人機(jī)圍棋對戰(zhàn)大比分1:3的時候,@黃有璨?寫了一篇文章《李世石所面臨的拷問,也許可以在<瘋狂動物城>中找到答案》,文中,黃有璨對比分表達(dá)了感傷:
一個天才級的職業(yè)棋手,理當(dāng)是視自己的名譽(yù)和技藝為性命的,但與AlphaGo的這輪對決,在前三局李世石是完敗。
要知道,這場完敗,可能不僅會影響到他的名譽(yù),甚至,更加可怕的是,他作為一位棋手的職業(yè)信仰——甚至可能不只是他,所有職業(yè)棋手們的職業(yè)信仰都將從此受到巨大的挑戰(zhàn)。
?
之后,黃有璨提出了一個問題:假如機(jī)器的計算能力已經(jīng)強(qiáng)大到了遠(yuǎn)超人類的地步,以至于在一些復(fù)雜決策上已經(jīng)可以比人更加智能,那么人類的出路在哪里?甚至是,人類存在的意義在哪里?而人類,又是否會逐漸被機(jī)器所奴役?
?
沿著這個命題,他提到了劉慈欣的一部短篇科幻小說,情節(jié)大概是這樣的:
某一天,人類終于遇到了一個科技發(fā)展程度遠(yuǎn)超自己的外星種族,對方是一個技術(shù)驅(qū)動的種族,他們的技術(shù)能力和已有的運(yùn)算能力,成百上千倍于人類,以至于人類世界中的一切,在對方眼中,都是自己借助技術(shù)可以輕易實現(xiàn)的,看起來都如此破舊和不值一提。
在如此巨大的差距面前,外星種族認(rèn)為人類世界中的一切都是無意義的,想要?dú)绲羧祟愂澜缰械囊磺小?/p>
但,人類代表在與對方對話時,顯得執(zhí)著又頑固,他們堅稱,人類世界中的有些東西,是哪怕科技程度發(fā)展遠(yuǎn)超人類的外星種族都做不到的。比如:詩歌,尤其是那種可以帶來一種直擊人類心靈的美感的作品。
崇尚以科技為核心的外星種族被這個觀點(diǎn)激怒了,他們試圖要憑借科技寫出超越人類偉大詩人——李白的詩歌,為此,他們開發(fā)了計算能力強(qiáng)大到了極致的程序,甚至開始讓程序模仿李白在寫詩前的一切行為,依靠學(xué)習(xí)獲得相似的體驗,例如:飲酒、游山玩水、美色相伴。
在技術(shù)的驅(qū)動下,外星種族試圖去結(jié)構(gòu)和分解所有這些體驗背后的一切,獲得“偉大的詩”產(chǎn)生背后的特定邏輯。但,最終外星文明痛苦的發(fā)現(xiàn),在技術(shù)和算法的推動下,自己雖然已經(jīng)能夠?qū)懗鲆恍┎诲e的詩,但它們并未能夠?qū)懗龀嚼畎椎脑姼琛R驗?,很多時候,偉大詩歌的創(chuàng)作,都是非邏輯的。
于是,為了寫出超越李白的詩,技術(shù)驅(qū)動下的外星文明想到了另一條理論上可行的路徑——窮舉法。也即,在符合韻律等規(guī)則的情況下,把所有可能的字詞組合都窮舉出來。
最終,外星文明成功的完成了這一壯舉——不計其數(shù)的詩歌被創(chuàng)作了出來,其中也必定包含了那些能夠超越李白的詩歌。
但是,外星種族最終仍然認(rèn)輸了。
因為,雖然那些詩歌上的巔峰之作已經(jīng)必然被創(chuàng)作了出來,但外星種族卻無法開發(fā)出一個具備詩歌鑒賞能力的程序,也就無法借助偉大的技術(shù)把這些巔峰之作從幾億億首詩中檢索出來。
這意味著,技術(shù)層面上外星種族雖然已經(jīng)確實超越了李白,但他們卻仍然沒有真正得到和擁有那些巔峰之作,因為它們無法被找到,無法被鑒賞,更無法被品味。
?
以上情節(jié),我們可以認(rèn)為:即使外星文明的技術(shù)能力和運(yùn)算能力,甚至是作詩的能力都超過了人類,也不代表人類就輸了,因為他們不具備鑒賞的能力。@半輕人?推送的《柯潔 vs. Google AlphaGo 第一局速記》一文中, 作者@王詠剛?從哲學(xué)的角度也提到了對決的意義:
圍棋之道,如只論勝負(fù),人類的所有圍棋書都可以燒了。還好,人類還可以在圍棋中求快樂,求感悟,求哲理。
?
文中,作者引用了職業(yè)棋手李喆說的話,他讀哲學(xué)的一個目的是為了探究下圍棋這件事對人類社會而言到底有何價值。人工智能來了,人們其實也可以從哲學(xué)層面去探究,人這樣一種神奇的存在對宇宙而言到底有何價值。如果我們只是宇宙的偶然過客,那我們有什么資格對機(jī)器智慧品頭論足?人的智慧和機(jī)器的智慧真的有高低貴賤之分?
?
AlphaGo 的創(chuàng)造者——人工智能企業(yè) DeepMind 的創(chuàng)始人 Demis Hassabis 表達(dá)了這場比賽的最終目的是去學(xué)習(xí)、探索圍棋的真諦:
這絕不是人和電腦之間的對抗,這是人用機(jī)器發(fā)現(xiàn)新的知識,就像哈勃望遠(yuǎn)鏡,它能帶來新的奧秘的發(fā)現(xiàn)。同時,它也能用在其他的領(lǐng)域,比如在制藥、醫(yī)療等方面,都可以使用人工智能來解決疑難問題。比如 Google 目前已經(jīng)在使用 DeepMind 的技術(shù)在數(shù)據(jù)存儲上節(jié)能減排了。而這場比賽的最終目的不是人類獲勝還是機(jī)器獲勝,最終目的都是去學(xué)習(xí)、探索圍棋的真諦。
?
當(dāng)然,今天只是柯潔和 AlphaGo “人機(jī)終極對決”的第一局,根據(jù)賽事安排,5月25日、27日還有兩場比賽,鹿死誰手尚未有定論,我們可以耐心靜待。
但是,結(jié)局或許已經(jīng)不重要了吧?(完)
?
愛盈利-運(yùn)營小咖秀 始終堅持研究分享移動互聯(lián)網(wǎng)App運(yùn)營推廣經(jīng)驗、策略、全案、渠道等純干貨知識內(nèi)容;是廣大App運(yùn)營從業(yè)者的知識啟蒙、成長指導(dǎo)、進(jìn)階學(xué)習(xí)的集聚平臺;