由 AlphaGo 到可自我進(jìn)化的機(jī)器人诞丽,比你預(yù)想的要快
還在下圍棋?足球賽才是人工智能進(jìn)擊人類的真正目標(biāo)
到了 2050 年旺订,敢不敢來(lái)一場(chǎng)足球人機(jī)大戰(zhàn)弄企?
1997 年,國(guó)際象棋特級(jí)大師加里·卡斯帕羅夫輸給 IBM 開(kāi)發(fā)的深藍(lán)計(jì)算機(jī)圍棋系統(tǒng)区拳,從此人們相信拘领,人工智能具有可塑性。就拿今年 Google AlphaGo 戰(zhàn)勝韓國(guó)棋手李世石這件事來(lái)說(shuō)樱调,人工智能的智能程度就已經(jīng)超乎了人類的想象约素。況且,Google 的人工智能團(tuán)隊(duì)也一直在不斷增強(qiáng) Deep Mind 的 AI 能力笆凌,除了讓人工智能寫(xiě)詩(shī)圣猎、寫(xiě)小說(shuō)、作曲乞而,還教它玩起了益智游戲送悔。
前不久,就有消息稱中國(guó)圍棋手柯潔年內(nèi)將戰(zhàn) AlphaGo晦闰,但比賽還未真正開(kāi)始放祟,又有消息顯示,柯潔被已 AlphaGo 反超呻右,排名由世界第一降至第二跪妥。這一系列的事情似乎都在向人類表示,人工智能即將超越人類声滥。
但圍棋真的是人工智能訓(xùn)練的最佳工具嗎眉撵?近日,國(guó)外一名來(lái)自赫特福德大學(xué)的人工智能教授 Daniel Polanl 發(fā)文表示落塑,物理形式的足球訓(xùn)練才是人工智能訓(xùn)練真正的歸屬纽疟。
從桌面的圍棋賽到物理形式的足球大戰(zhàn)
對(duì)于人工智能來(lái)說(shuō),圍棋已經(jīng)足夠成為一個(gè)任務(wù)艱巨的挑戰(zhàn)項(xiàng)目憾赁。圍棋比賽涉及到錯(cuò)綜復(fù)雜的戰(zhàn)術(shù)污朽,比如對(duì)每一步棋子的走勢(shì)進(jìn)行預(yù)估和判斷×迹基于大量棋局的訓(xùn)練蟆肆,人工智能算法將能對(duì)一系列錯(cuò)誤的走勢(shì)進(jìn)行評(píng)估矾睦。
而直到本世紀(jì)初,圍棋人工智能程序的進(jìn)展仍然不大炎功,甚至還能被業(yè)余愛(ài)好者打敗枚冗。到了 2006 年,蒙特卡羅算法(Monte Carlo tree search)的出現(xiàn)蛇损,以及人們對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)的重新探索赁温,使得這一局勢(shì)發(fā)生了改變。
得益于這些新技術(shù)的融入和整合淤齐,AlphaGo 得到了大量的改進(jìn)股囊,最終在今年 3 月份擊敗世界圍棋冠軍李世石。雖然勝局已定床玻,人工智能的深度學(xué)習(xí)還在繼續(xù)毁涉。
自 1997 年加里·卡斯帕羅夫戰(zhàn)敗后沉帮,科學(xué)界普遍認(rèn)為锈死,人工智能所要應(yīng)對(duì)的挑戰(zhàn)不應(yīng)只是桌面上的腦力游戲,相反穆壕,它還需要以肢體的表現(xiàn)形式應(yīng)對(duì)現(xiàn)實(shí)世界中的挑戰(zhàn)——足球比賽就是一個(gè)很好的挑戰(zhàn)方式待牵。
踢足球?qū)τ谌祟悂?lái)說(shuō)并非難事,但在 1997 年喇勋,能有一個(gè)會(huì)行走的機(jī)器人缨该,用兩腿對(duì)足球進(jìn)行控制,還要會(huì)在摔倒的時(shí)候爬起來(lái)川背,并且在球場(chǎng)上能與隊(duì)友進(jìn)行溝通……這些幾乎是不可能的事情贰拿。因?yàn)樵诋?dāng)時(shí),只有極少數(shù)的實(shí)驗(yàn)室能夠做出會(huì)行走的人形機(jī)器人熄云。
機(jī)器人世界杯與足球人工智能訓(xùn)練
在索尼電腦科學(xué)研究所所長(zhǎng)北野宏明( Hiroaki Kitano )和曼努埃拉·維羅索(Manuela Veloso)等人的倡導(dǎo)下膨更,機(jī)器人足球世界杯(Robo Cup)比賽應(yīng)運(yùn)而生,其官方目標(biāo)為:在 2050 年前缴允,研發(fā)出一支能戰(zhàn)勝人類的人形機(jī)器人足球隊(duì)荚守。
在機(jī)器人技術(shù)還不夠發(fā)達(dá)的情況下,機(jī)器人世界杯一開(kāi)始采用的是輪式機(jī)器人练般,并且僅在二維平面上進(jìn)行簡(jiǎn)單的模擬比賽矗漾。但很快,后來(lái)的賽事引進(jìn)了索尼的四足機(jī)器狗 AIBO(雖然并非是人形機(jī)器人薄料,但相比輪式機(jī)器人已經(jīng)是很大的飛躍)敞贡。
直到 2003 年,人形機(jī)器人球員才進(jìn)入到了這場(chǎng)角逐中摄职,但其起初的表現(xiàn)力也十分有限:幾乎每位「足球運(yùn)動(dòng)員」都會(huì)出現(xiàn)雙腳顫抖的問(wèn)題誊役,一旦被足球碰上虑稼,也極容易摔倒。
第 20 屆機(jī)器人足球世界杯于今年 6 月底在萊比錫舉行势木,在逐年的比賽中蛛倦,這些人形機(jī)器人球員的性能得到了很大的改善,比如啦桌,其腳步的穩(wěn)定性得到了增強(qiáng)溯壶,即使摔倒了也能迅速的爬起,機(jī)器人球員之間的溝通能力也有了顯著的進(jìn)步甫男。
·2015 年機(jī)器人世界杯比賽視頻
從去年的賽事開(kāi)始且改,為了 2050 年的人機(jī)大戰(zhàn)做準(zhǔn)備,這些機(jī)器人球員的比賽環(huán)境已被做了修整:原本的綠色毛毯被人造草坪替代板驳,球和門柱均采用白色又跛。這對(duì)于機(jī)器人對(duì)目標(biāo)的辨識(shí)能力和步伐的穩(wěn)定性都具有一定的挑戰(zhàn)。所以若治,在今年的比賽中慨蓝,這些機(jī)器人球員的表現(xiàn)較去年的會(huì)稍遜色些。
·2016 年機(jī)器人世界杯比賽的視頻
足球人工智能訓(xùn)練有多復(fù)雜端幼?
目前礼烈,許多實(shí)驗(yàn)室有了屬于自己的機(jī)器人球隊(duì),其中不少足球機(jī)器人的定位系統(tǒng)采用了與圍棋機(jī)器人 AlphaGo 同樣的蒙特卡洛算法婆跑。
據(jù)悉此熬,圍棋的點(diǎn)位高達(dá) 361(19*19),但其每個(gè)點(diǎn)位的坐標(biāo)都是唯一確定的滑进,并且在目前的可計(jì)算范圍內(nèi)犀忱。對(duì)于非平面運(yùn)動(dòng)的足球而言,沒(méi)有離散的點(diǎn)以供定位扶关,足球機(jī)器人要不停優(yōu)化自己的動(dòng)作阴汇,還需對(duì)位置坐標(biāo)進(jìn)行不斷的細(xì)分⊥陨螅總的來(lái)說(shuō)鲫寄,這是一個(gè)三維空間內(nèi) 22 名球員以及 1 只足球的運(yùn)動(dòng)定位問(wèn)題。
另外疯淫,人工智能足球機(jī)器人在實(shí)際環(huán)境中還面臨著更多的挑戰(zhàn):在跑動(dòng)的過(guò)程地来,如何掌控好腳下的足球;在耀眼的陽(yáng)光下熙掺,如何準(zhǔn)確判斷出足球的所在位置未斑;在濕漉漉的草地上如何確保自身的穩(wěn)定性;保證充足的電源币绩,以完成長(zhǎng)達(dá) 45 分鐘的比賽蜡秽;需要采用足夠堅(jiān)固的材料府阀,不至于被撞碎…… 這其中都涉及到各種復(fù)雜的技術(shù)解決方案。
「機(jī)器人世界杯引發(fā)了我們對(duì)人工智能更多細(xì)微的思考芽突∈哉悖」Daniel Polanl 如是說(shuō)。
本文內(nèi)容采編自:Robohub
這樣的足球賽刑赶,“球員”受傷程度是不是會(huì)大幅度上升?