人民網
人民網>>體育>>綜合

人機互動推動科技進步 阿爾法圍棋激發人類潛力 

劉敏華
2016年03月16日14:00 | 來源:深圳晚報
小字號

和卡斯帕羅夫與“深藍”的對決一樣,李世石與阿爾法圍棋的“人機大戰”,是能被同時載入圍棋史和科技史的一場經典對決。圍棋,是人類最具智慧的競技之一,人工智能研發,是人類最具挑戰性的科技探索。今后人類必將有更多“驕傲”被攻克,但每一次攻克與被攻克間的纏斗,都是激發人類潛力的最好契機。

“你每天上網搜索,各種電子商務行為,你滴滴打車出行方便了,這些都和人工智能息息相關。我們有法律,我們可以規范人工智能的發展方向。任何技術都是把雙刃劍,你要發展電腦病毒,就可能被抓起來。如果說人工智能要做一件事,一定是有人類在背后指揮它,就跟導彈發射一樣,肯定是人類設定的程序,人工智能只是去執行。”——中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任王飛躍

“在能定義出來的領域,人類或終將被人工智能取代。但有些開放式的問題就不太好定義,比如畫一幅優美畫卷,或者找到宇宙運行深刻規律,這些方面人工智能恐怕還難以勝任。”

——彩雲天氣創始人袁行遠

“當初,汽車代替馬車,馬夫、修馬車的人是不適應的,認為自己的飯碗被搶了,但歷史証明,這種替代提高了效率。未來人工智能如果取代了所謂的白領,或許意味著我們社會需要發生一個結構性變化。人工智能一定會有它不擅長的,比如創造性思維,甚至休閑娛樂,人工智能總沒法替代人類去休閑。”

——北師大系統科學學院副教授、集智俱樂部創始人張江

“人機大戰對於人工智能的發展意義很有限。解決了圍棋問題,並不代表類似技術可以解決其他問題,自然語言理解、像理解、推理、決策等問題依然存在,人工智能的進步被夸大了。”

——復旦大學計算機科學技術學院教授、博士生導師危輝

問師

參悟阿爾法圍棋之道 我們學到了什麼?

第三次圍棋革命 已有追隨者

人機大戰終焉,時刻關注著這場巔峰較量的梁偉棠九段,顯然意猶未盡——他直言李世石過於保守,不在巔峰狀態,也遺憾未看到阿爾法圍棋如何應對人類打出的大模樣布局。如同梁偉棠九段一般,觀摩“人機大戰”的職業棋手們不在少數,他們在驚嘆阿爾法圍棋超凡水准的同時,能從“阿老師”的圍棋之道上悟出什麼“絕世秘籍”呢?

三大絕活超越人類極限

“圍棋本身就是一個‘錯誤’的游戲,誰的失誤多就落下風,而阿爾法圍棋失誤得太少了”,梁偉棠感嘆阿爾法圍棋在常規下法上對於失誤的掌控能力:“十幾年前,就有一名這樣的棋手以此獨步天下。”

說阿爾法圍棋有李昌鎬的影子,確實不假,但它的勝利,卻有獨立而鮮明的“個人風格”。

滴水不漏,相持階段穩如泰山——在第一盤中,阿爾法圍棋面對李世石的強勢進攻,防得滴水不漏。在那樣激烈的對抗下,李世石完全抓不到它的失誤,反而被它逮住失誤並給出致命一擊。梁偉棠驚訝於阿爾法圍棋在相持階段的嚴謹計算,並回憶當年的李昌鎬就是以這“順勢而為”的絕招走上棋壇巔峰。

當局者清,觀子計算不知疲倦——與李昌鎬一樣,他們會在強行與對手進入相持階段后,抓住失誤迅速擊敗對手。對局中,人類高強度思考幾個小時就疲倦了,而阿爾法圍棋不會,它思路清楚得像是在觀棋的其他高手們。李世石的一些“昏著”就是因為在人體達到極限的情況下出現的失誤,而這些失誤直接導致了最終投子認輸,難怪棋聖聶衛平也不禁贊嘆阿爾法圍棋的中盤實力堪稱“十二段或十三段”。

熟能生巧,量化局勢選擇價值——阿爾法圍棋在局部的落子選擇即是精髓所在,它“大腦”之一落子選擇器的原理,就是將圍棋中一些虛無的成分量化,計算出每一步棋的價值,從而理性化地做出選擇——這種選擇,是以多達3000萬盤的人類對局為基礎的。如果說上面兩點,人類還能通過訓練達到極致,那麼這一點對人類來說,幾乎是不可能完成的任務。

並非好老師,更像好陪練

“阿老師”紅了。據稱有超過1億人次觀看人機大戰,圍棋在全球范圍內這樣受追捧,還是史上頭一次。

4比1戰勝世界冠軍李世石之后,現排名世界第四的阿爾法圍棋名震棋壇。北大才子李喆六段對阿爾法圍棋給予了高度評價,認為它的出現是圍棋史上第三次革命:“阿爾法圍棋的理論顛覆了我們傳統固有的棋理。吳清源、李昌鎬的出現帶來了圍棋史上前兩次革命,阿爾法圍棋的出現則是第三次革命。”

名聲已出,想必門下得收“弟子”啊。然而“阿老師”的弟子們,隻能自學成才。就在前幾日百靈杯公開賽預選賽中,對電腦頗有研究的羅洗河九段就使用了類似“阿爾法圍棋流”的招法,戰勝了等級分排名第三的周睿羊九段,爆出不小的冷門。職業選手“偷師”阿爾法圍棋並不稀奇,而學來的套路可以弱勝強的話,就十分恐怖了。

那麼“阿老師”的出現,是否會影響到棋手們今后的學棋方式呢?

梁偉棠九段認為,阿爾法圍棋並非是個好老師,姑且隻能說是個好陪練。首先,他認為圍棋的學習伴隨著價值觀的建立,而這些棋道的基礎與啟蒙,隻能靠老師來言傳身教。

其次,阿爾法圍棋的招數,沒有些許水平是看不懂的,羅洗河能用的一般棋手不一定能用。最重要的一點,阿爾法圍棋的缺陷就是不能講題,梁偉棠說:“我們職業棋手在對局結束之后,一般都會復盤來看看究竟贏在哪兒或輸在哪兒。”

投子認輸的李世石還在棋盤上不停地擺子獨自復盤時,工作人員就來將他請去發布會了。李世石郁悶地站起身,系了一條他結婚時才會佩戴的領帶,收拾收拾心情走進了發布會現場。對此結果他依舊面帶笑容,與“阿老師”大戰五局的他想必也是悟出了自己的一套“秘籍”吧。(陳宇譞)

攻守

圍棋之后, 人機下一個“戰場”在哪兒?

靈感創新是 人類最后堡壘

李世石與阿爾法圍棋的巔峰之戰最終以1比4落下大幕,人工智能能否超越人類的話題卻不會停止。

“人工智能”一詞,最初是在1956年DARTMOUTH學會上提出的,此后,人工智能一直處於對人類智力的追逐之中。擊敗李世石之后,谷歌研發人員說,DeepMind人工智能技術的下一項挑戰將是即時戰略電子游戲《星際爭霸》。這不禁讓人想問,人類究竟有哪些堡壘已被人工智能攻克,還有哪些依然堅不可摧呢?

圍棋:被攻陷是注定之事

此前,學者稱“圍棋是地球人的最后一個堡壘”。支撐這一觀點的是圍棋的窮舉變化數量,對機器運算的要求最高。

其實早在1999年,微軟亞洲研究院副院長芮勇就曾與打敗國際象棋大師的“深藍”電腦研發者許峰熊探討過圍棋AI。當時得出的結論是,隨著近幾年GPU深度定型處理能力增強,算法上的各種提高,機器打敗各種棋類冠軍這一天終究會來。

圍棋是規則固定明確、邏輯精確嚴密的相對單純的智力游戲,而且對記憶力有很大的依賴,真可謂正中電腦下懷,最后圍棋人機大戰的結果也是人類代表李世石以1比4敗下陣來。

麻將:輕鬆到懶得一試

從博弈論的角度來講,圍棋是完全信息動態博弈,麻將屬於非完全信息動態博弈。圍棋中對局雙方所掌握的信息是對稱的,麻將中對局者所掌握的信息不對稱。

從復雜度來看,麻將要遠遠小於圍棋。就麻將的總牌數136張來說,每人14張,組合共有326520504500種,遠遠小於圍棋的2.08×10170。不足1012的手牌種類意味著麻將AI完全可以提前計算好每手牌的打法估值,並儲存在資料庫中,打牌時調用即可。

盡管別家打的牌雖然復雜度會很高(136張牌的牌牆組合為 4.3×10185種,甚至超越了圍棋的復雜度),但別家打的10張牌大多隻有1~2張是有用的信息,AI隻需要識別這種模式並搜索對比以往對局的牌譜即可。

所以相對於圍棋來說,人類研究甚少的麻將,將更容易被人工智能擊敗。

德州扑克:

無限加注=極限爆炸

2015年1月,阿爾伯塔大學的教授邁克爾·鮑林和他的同時用“CFR+算法”破解了雙人德州扑克。但在同年4月24日至5月8日,4位世界范圍內最好的德州單挑環節專家與德州扑克人工機器人“Claudico”展開了為期兩個星期的對決,最終人類取勝。這就是有限注德州扑克和無限注德州扑克的難度區別了。

有限注德州扑克和無限注德州扑克最大的區別在於,有限注德州扑克的再加注有限制,同時最多隻能加注3次。無限注德州扑克加注次數與數量沒有限制。當任意額度下注被允許,那麼扑克游戲的極限爆炸,使無限注扑克變成比圍棋更“大”的游戲。

藝術創作:

有技無魂實難超越

相比於弈棋,進行寫小說畫畫等藝術創作又是完全不同的情況。藝術創作最重要的決定因素是作者對於人類自身與人類社會的理解與思考。可以看出,人工智能在進行藝術創作時,就其本質而言,是對人的思維的信息過程的模擬,並沒有像“阿爾法狗”那般能超越人類。

人工智能再厲害,也畫不出《蒙娜麗莎》,寫不出《紅樓夢》,編不出《命運》交響曲,更拍不出《教父》這樣的電影。藝術的創造力,靈感與創新,才是人類智慧最后的堡壘,是人工智能所不能超越的。假如有一天,人工智能在藝術創作方面超越了人類,那就不是工具在陪“主人”玩游戲了。

(責編:實習生馬曉春、楊磊)

分享讓更多人看到

返回頂部