反擊之戰(zhàn)膨疏!李世石戰(zhàn)勝阿爾法,為人類贏回了尊嚴(yán)
20 年前就打敗了人類,「深藍(lán)」開發(fā)者又如何看待 AlphaGo祝谚?
IBM 深藍(lán)的開發(fā)者宪迟,如何看待AlphaGo的圍棋之戰(zhàn)?
DeepMind 的圍棋人工智能 Alphago 對人類的碾壓來得促不及防,現(xiàn)在它以 3:1 領(lǐng)先圍棋冠軍李世石席爽。由于圍棋的復(fù)雜性意荤,很多人工智能專家曾認(rèn)為,計(jì)算機(jī)要戰(zhàn)勝頂尖人類只锻,還需要數(shù)十年時間玖像。而在約二十年前,IBM 也同樣在人機(jī)之間挑起過爭論齐饮,當(dāng)時它開發(fā)的深藍(lán)計(jì)算機(jī)打敗了國際象棋大師加里·卡斯帕羅夫 (Garry Kasparov)捐寥。
Murray Campbell 是深藍(lán)開發(fā)中的關(guān)鍵人物,也是 IBM 認(rèn)知計(jì)算部門的高級經(jīng)理祖驱,正是這一部門管理著現(xiàn)在的 Watson 人工智能平臺握恳。那這位深藍(lán)的開發(fā)者,是怎樣看待新世紀(jì)人機(jī)之戰(zhàn)的呢捺僻?最近 Theverge 與他進(jìn)行了對話乡洼,深圳灣對文章編譯如下 (有刪減):
在20年前,你們?nèi)绾谓鉀Q象棋問題匕坯,打敗卡斯帕羅夫的束昵?
我們還在卡耐基梅隆大學(xué)讀研時,就在開發(fā)象棋程序了葛峻,接下來 IBM 招了我們其中三個來開發(fā)下一代象棋計(jì)算機(jī)锹雏,也就是后來的深藍(lán)。我們當(dāng)時意識到术奖,單純的暴力破解方法很難打敗世界冠軍逼侦;但另一方面匿辩,擁有強(qiáng)大的計(jì)算力確實(shí)有用,而且程序的能力確實(shí)與計(jì)算速度有關(guān)榛丢,這有文獻(xiàn)支持。所以我們將一些人工智能類的先進(jìn)算法 (搜索和評估方面的)挺庞,與大型超級計(jì)算機(jī)相結(jié)合晰赞,來開發(fā)冠軍級別的程序。1996 年的比賽我們失敗了选侨,但次年用改進(jìn)的系統(tǒng)卷土重來掖鱼,并取得了勝利。
你當(dāng)時為什么會做這事援制?是出于對象棋的興趣戏挡,還是對計(jì)算的挑戰(zhàn)?
兩者都有晨仑。我對象棋很感興趣褐墅,在成為計(jì)算機(jī)科學(xué)家前也是象棋玩家,還曾獲得過加拿大亞伯達(dá)省的冠軍洪己。不過我也認(rèn)識到妥凳,真正厲害的高手有一些我沒有的東西。這也讓我想知道答捕,怎樣才能開發(fā)一個高水平的計(jì)算機(jī)來下棋呢逝钥?后來加入 IBM 時,我感到這是個機(jī)會拱镐,可以證明自己的想法艘款。
除了個人興趣,打敗人類也對早期的計(jì)算機(jī)科學(xué)來說是個挑戰(zhàn)沃琅。1949年哗咆,知名數(shù)學(xué)家克勞德·香農(nóng) (Claude Shannon) 發(fā)表了一篇論文,描述了如何創(chuàng)造一臺象棋計(jì)算機(jī)阵难,并認(rèn)為這是一個大挑戰(zhàn)岳枷。
開發(fā)中,多大程度上你自己要了解國際象棋呜叫?是輸入一些規(guī)則就行了空繁,還是根據(jù)自己的經(jīng)驗(yàn)來?
我認(rèn)為了解一些象棋知識很重要朱庆。在開發(fā)的早期階段盛泡,我們不需要成為個中高手,而且當(dāng)時也不是娱颊。但進(jìn)行到最后階段時傲诵,會有很多關(guān)于如何下棋凯砍,以及大師的標(biāo)準(zhǔn)是什么的細(xì)節(jié)需要考慮,所以有個高手來幫忙很重要拴竹。當(dāng)時我們請了象棋大師 Joel Benjamin 來幫忙悟衩。最后,我們還請了其他大師與機(jī)器對戰(zhàn)栓拜,測試系統(tǒng)性能座泳。
當(dāng)時的目標(biāo)是模仿人類風(fēng)格,還是開發(fā)一個不惜一切取得勝利的系統(tǒng)幕与?
我們完全沒想著模仿人類挑势,只不過是人類多數(shù)情況下,棋下得不錯啦鸣,所以我們也希望系統(tǒng)如此潮饱。人類的風(fēng)格被研究得很好,雖然沒被研究透诫给,但心理學(xué)家數(shù)十年前就在研究了香拉。而得到的結(jié)論是,象棋高手在考慮走棋時蝙搔,只會關(guān)注少量的步數(shù)和位置缕溉。有時他們會計(jì)算到很深,才能決定怎么走吃型,有時候不會证鸥。但他們很擅長棋局評估和搜索機(jī)制,這有助于決定選擇哪種方式探索棋局勤晚。模仿人類是很困難的事枉层。
最初的人工智能確實(shí)想讓計(jì)算機(jī)有人類的網(wǎng)絡(luò),但往往會敗給那些更「計(jì)算機(jī)風(fēng)格」的計(jì)算機(jī)赐写,即少進(jìn)行評估鸟蜡,盡可能計(jì)算可能的步數(shù)。僅靠純粹的搜索確實(shí)能達(dá)到一定的水平挺邀,但我們也意識到揉忘,這還不夠,還是得在某些方面模仿人類端铛。人類長于根據(jù)關(guān)鍵路線進(jìn)行深入思考泣矛,我們也希望系統(tǒng)能這樣做,而這也是深藍(lán)能成功的一個重要原因禾蚕。
到 1997 年您朽,多數(shù)玩家都知道卡斯帕羅夫被打敗了,他們認(rèn)為深藍(lán)的風(fēng)格很不尋常嗎换淆?
是的哗总,有這樣一種說法几颜,你看到計(jì)算機(jī)下出很出乎意料,或反直覺的一步棋時讯屈,會稱它為「計(jì)算機(jī)走法」蛋哭。這是因?yàn)槿祟愑羞@樣的思考方式,而有些走法涮母,人類高手也不會用具壮。這也是為何計(jì)算機(jī)能打敗人類,雖然在某種程度上說哈蝇,它們無法準(zhǔn)確評估棋局:由于它們不同尋常,所以能看見一些人類不會看見的走法攘已。不過有趣的是炮赦,現(xiàn)在的年輕棋手會比老一代更容易走出計(jì)算機(jī)的走法,可能是因?yàn)樗麄円恢庇懈?jì)算機(jī)下棋样勃。
所以計(jì)算機(jī)戰(zhàn)勝人類吠勘,也讓人類變得更優(yōu)質(zhì)?
很正確峡眶。
在計(jì)算機(jī)科學(xué)角度上剧防,圍棋與國際象棋有什么區(qū)別?
兩者都需要強(qiáng)大的計(jì)算量辫樱,都很復(fù)雜峭拘。但圍棋有一些象棋沒有的特點(diǎn),那就是很難評估它的棋局狮暑。像我一樣的中級象棋選手鸡挠,可能幾個小時就能寫一個評估函數(shù),用于判斷象棋的棋局搬男。雖然達(dá)不到大師的水平拣展,但與搜索結(jié)合起來,已經(jīng)足夠下高水平的棋了缔逛。
但圍棋會隨著時間推移而衍變备埃,而且結(jié)構(gòu)和互動非常復(fù)雜。象棋中的棋子會移動褐奴,沒有很多靜態(tài)結(jié)構(gòu)按脚,甚至只要數(shù)下誰的子多,你就能很好地預(yù)測誰會贏∏该樱現(xiàn)實(shí)當(dāng)然會更復(fù)雜乘寒,但這是個不錯的經(jīng)驗(yàn)。圍棋則完全不是這樣匪补,你沒法數(shù)棋子伞辛,因?yàn)橐话銇碚f雙方都差不多烂翰,而且評估起來難得多。所以我覺得蚤氏,DeepMind 的高明之處在于甘耿,通過機(jī)器學(xué)習(xí)方法找到了更好的棋局評估方法。
你怎么看待 AlphaGo竿滨,它用的技術(shù)當(dāng)時能用嗎佳恬,能不能用在深藍(lán)上?
我也與 DeepMind 的人討論過這種問題于游。首先我認(rèn)為 AlphaGo 很厲害毁葱,也提高了現(xiàn)在的人工智能水平。如果他們證明 AlphaGo 是一種通用機(jī)制贰剥,還能用在除圍棋外的其它游戲中倾剿,我會更震驚。
至于這種方法能不能用在國際象棋上蚌成,我覺得它可能讓程序比所有人類都厲害前痘,但不會是最先進(jìn)的,因?yàn)楝F(xiàn)在的象棋程序已經(jīng)很強(qiáng)大担忧,且超越了人類芹缔。象棋在搜索上是不同的游戲,即搜索對象棋很重要瓶盛,但在圍棋上不是這樣最欠。圍棋中也需要深層次的搜索,但其中直覺蓬网,評估以及互動更為重要窒所。
可以說,沒有什么能替代搜索帆锋,現(xiàn)代程序吵取,比如我知道的最好的 Komodo,都有搜索可能的走法上很高效锯厢,搜索的層次也很深皮官。我認(rèn)為 AlphaGo 所用的通用機(jī)制就算用在象棋上,也無法重塑搜索实辑,它需要其它的突破捺氢。
AlphaGo 能與自己下棋,看起來能力會不斷提升剪撬。
它在與自己下棋時摄乒,確實(shí)看起來有所提升。我不知道這是否會有限制,它能否不斷改進(jìn)馍佑。但根據(jù)我對兩種游戲的理解斋否,AlphaGo 用的方法直接用在象棋上時,無法打敗現(xiàn)有的程序拭荤。
處理能力對兩類游戲來說有多重要茵臭?
在象棋中可能沒那么重要。處理能力越強(qiáng)當(dāng)然越好舅世,但現(xiàn)在的智能手機(jī)已經(jīng)能打敗任何人了旦委。算法已經(jīng)有了優(yōu)化,程序也相當(dāng)高效雏亚。AlphaGo 似乎用了很多處理能力缨硝,發(fā)表的論文上也說在 CPU 和 GPU 更多時,表現(xiàn)也更好罢低。(編者注:上周 DeepMind 表示追葡,逐漸達(dá)到了收益遞減的臨界點(diǎn),即再增加計(jì)算性能似乎無法讓計(jì)算機(jī)的表現(xiàn)更好)
AlphaGo 的勝利對人工智能領(lǐng)域來說會意味著什么奕短?會有下一個目標(biāo)或里程碑嗎?
我認(rèn)為匀钧,這會讓圍棋和象棋的研究減少翎碑。會有很好的機(jī)制處理這類游戲,部分是因?yàn)橹梗m然它們很復(fù)雜日杈,但在另一方面上看又很簡單。他們都是完美的信息游戲佑刷,是零和游戲莉擒,也是輪流來玩的游戲,所以沒有運(yùn)氣的成分在里面瘫絮。但現(xiàn)實(shí)世界并不如此涨冀,你在決策中很少能完全了解情況,決定的結(jié)果也很難理清楚麦萤。
所以我很想知道如何將 AlphaGo 的系統(tǒng)用在其它游戲上鹿鳖,以及在沒有人類輸入的情況下用在圍棋上會怎么樣。這些都可以成為里程碑壮莹,但我認(rèn)為我們會瞄準(zhǔn)棋類游戲之外翅帜。將這種技術(shù)用在現(xiàn)實(shí)世界的問題會更有價值,也是我們應(yīng)該做的命满。不過在這種轉(zhuǎn)移過程中涝滴,系統(tǒng)不會很快超越人類,因?yàn)槿祟惻c機(jī)器都有自己擅長的方面,需要互補(bǔ)歼疮。
最直接的現(xiàn)實(shí)使用是什么杂抽?
我認(rèn)為可能是醫(yī)療保健方面。我不認(rèn)為計(jì)算機(jī)會很快幫人類做決定腋妙,但它們能分析數(shù)據(jù)默怨,幫人類做出更好的決定。算法可以幫助識別出數(shù)據(jù)中的模式骤素,為醫(yī)生提供決策洞見匙睹,讓決策更準(zhǔn)確。