北京時(shí)間1月25日凌晨2點(diǎn),暴雪與谷歌deepmind團(tuán)隊(duì)合作研究的人工智能“alphastar”正式通過直播亮相。按照直播安排,alphastar與兩位《》人類職業(yè)選手進(jìn)行了5場(chǎng)比賽對(duì)決演示。加上并未在直播中演示的對(duì)決,在人類vs alphastar人工智能的共計(jì)11場(chǎng)比賽中,人類只取得了一場(chǎng)勝利。

這場(chǎng)大戰(zhàn)以人工智能的近乎完勝而告終。從結(jié)果來(lái)看,人類似乎很快就無(wú)法在《星際爭(zhēng)霸2》這款難度非常高的游戲上與人工智能相抗衡。
本文將會(huì)以較專業(yè)的星際技戰(zhàn)術(shù)角度出發(fā),通過較為通俗的講解,幫助大家理解這場(chǎng)勝利的意義究竟在哪里。
(特別鳴謝kevinliu對(duì)本文中人工智能專業(yè)內(nèi)容指導(dǎo))
1. 這場(chǎng)勝利真的意味著《星際爭(zhēng)霸2》中人工智能已經(jīng)可以戰(zhàn)勝頂尖人類了嗎?
盡管這次比賽人類沒有派出當(dāng)前實(shí)力最強(qiáng)狀態(tài)最好的職業(yè)選手出戰(zhàn),但顯然已經(jīng)有很多朋友希望通過”人工智能是否已經(jīng)具備戰(zhàn)勝人類職業(yè)選手的實(shí)力“來(lái)參考不久的未來(lái)人工只能是否有機(jī)會(huì)“擊敗全人類”。
所以回答這個(gè)問題其實(shí)需要一個(gè)必要條件。那就是看如何看待挑戰(zhàn)人類的人工智能。以絕大部分的專業(yè)人士看法,如果人工智能戰(zhàn)勝人類,應(yīng)該是通過和人類差不多的操作或是比人類對(duì)游戲更先進(jìn)的戰(zhàn)術(shù)理解來(lái)取勝,才足以讓人信服。
那么這次比賽中兩位輸給人工智能的選手能夠讓人信服嗎?
恐怕很難。

第一個(gè)出戰(zhàn)的tlo在比賽中使用了他不擅長(zhǎng)的種族,所表現(xiàn)出的技戰(zhàn)術(shù)實(shí)力只能達(dá)到普通業(yè)余玩家的水平,甚至連業(yè)余高手都略有勉強(qiáng)。那么自然也就沒有了參考“戰(zhàn)勝職業(yè)選手“的意義了。只能說(shuō),與tlo對(duì)決的這款alphastar,已經(jīng)擁有了在pvp(神族vs神族)對(duì)抗中略強(qiáng)于一些業(yè)余玩家的技戰(zhàn)術(shù)水平了。
第二個(gè)出戰(zhàn)的mana可是正經(jīng)的使用最擅長(zhǎng)種族的職業(yè)選手了,巔峰時(shí)期也曾拿過暴雪世錦賽的亞軍。但mana依然輸給了人工智能。
這場(chǎng)勝利有參考意義嗎?
客觀的說(shuō),還有異議。
大部分人持反對(duì)意見的原因非常明顯,戰(zhàn)勝mana的這款alphastar擁有著超乎人類生理極限的操作能力。
畢竟人類希望和圍棋一樣,在一個(gè)相對(duì)平等的條件下與人工智能對(duì)決,從而讓人類認(rèn)識(shí)對(duì)這個(gè)游戲玩法的認(rèn)知積累是否還存在缺陷。
所以在如何保證平等條件的爭(zhēng)論中,是否需要像人類一樣模擬受迫性失誤、是否需要像人類一樣有反應(yīng)閾值一直都存在激勵(lì)爭(zhēng)議。但在是否擁有超越人類勝利極限的運(yùn)動(dòng)能力上,確是爭(zhēng)論極少的,畢竟人們?cè)趯?duì)人工智能對(duì)抗人類的主流認(rèn)知中,是希望人工智能對(duì)手也是個(gè)虛擬的人。
回顧mana和alphastar的那五場(chǎng)大戰(zhàn),以在直播中播放的一場(chǎng)比賽為例,alphastar所展示的三線追獵牽制操作是人類幾乎不可能完成的。完成這種操作必須要在那長(zhǎng)達(dá)1分多的時(shí)間內(nèi)保持非??斓氖炙?、精準(zhǔn)的點(diǎn)擊、精準(zhǔn)的屏幕移動(dòng)以及距離判斷,更重要的是要杜絕人類基本無(wú)法克服的受迫性失誤。
通俗點(diǎn)說(shuō),如果同樣是帶兵打仗,我的排兵布陣和打仗策略和你差不多,但你的部隊(duì)不知疲倦,我軍打累了要休息而敵軍依然還能扛著大刀往前殺,那就有點(diǎn)賴皮了。
除此以外,目前的alphastar在技術(shù)上仍有很大的局限性。從當(dāng)天的比賽來(lái)看,目前deepmind能向大家展示的只能局限在唯一的地圖、唯一的種族對(duì)抗以及唯一的平衡性環(huán)境中。相比需要應(yīng)對(duì)每個(gè)賽季至少4-5張不一樣的地圖、三個(gè)不同種族對(duì)抗、經(jīng)常修改的平衡性版本的人類職業(yè)選手來(lái)說(shuō),就好比踢足球alphastar只和你比射點(diǎn)球,那怎么能算戰(zhàn)勝人類?
但從純粹的技戰(zhàn)術(shù)角度來(lái)討論,這一次人工智能大戰(zhàn)還是給了人類一些啟發(fā),主礦的農(nóng)民分配以及一些運(yùn)營(yíng)補(bǔ)農(nóng)民的思路,確實(shí)給了一些核心星際玩家新的思路。
盡管拋開單純的比分結(jié)果并不能讓我們信服人工智能已經(jīng)可以挑戰(zhàn)甚至戰(zhàn)勝職業(yè)選手,但從它所表現(xiàn)出的潛力已經(jīng)學(xué)習(xí)程度來(lái)看,仍然是值得期待的。
2. 人工智能有哪些值得星際專業(yè)人士贊嘆的地方?
在第一個(gè)問題中我們似乎一直在唱衰deepmind團(tuán)隊(duì)研發(fā)的alphastar。但嚴(yán)格來(lái)說(shuō),deepmind首次公開alphastar對(duì)于星際專業(yè)人士來(lái)說(shuō),仍然超出了預(yù)期,非常值得贊嘆。
和一些命名為人工智能的星際腳本程序相比,alphastar更像我們想象的人工智能了,它會(huì)靈活的使用戰(zhàn)術(shù),作出更像是經(jīng)過”思考“后的游戲指令。
alphastar所展現(xiàn)出的學(xué)習(xí)能力已經(jīng)非常強(qiáng)大。它甚至已經(jīng)學(xué)會(huì)判斷優(yōu)先攻擊哪個(gè)目標(biāo)、學(xué)會(huì)怎樣使用對(duì)手的戰(zhàn)術(shù)、以及基礎(chǔ)的判斷對(duì)手的打法和使用反制打法的能力,完成這些在我們看來(lái)比較抽象化的邏輯能力,就需要更加強(qiáng)大的算法能力了。

更加復(fù)雜的算法帶來(lái)更加擬人化的高級(jí)邏輯推理能力也是deepmind選擇用《星際爭(zhēng)霸2》來(lái)攻克人工智能技術(shù)瓶頸的原因之一。對(duì)于星際玩家來(lái)說(shuō) ,更加強(qiáng)大的邏輯能力自然有可能會(huì)誕生更多人類還沒想到的新戰(zhàn)術(shù)、新運(yùn)營(yíng)和新打法體系,這是非常值得期待的。
3. 未來(lái)的《星際爭(zhēng)霸2》人工智能vs人類大戰(zhàn)會(huì)是怎樣?
要知道這次參賽的alphastar只進(jìn)行了為期一周的自我對(duì)練和學(xué)習(xí),但學(xué)習(xí)量已經(jīng)相當(dāng)于正常人的200年,這和alphago一樣,人工智能有著非??植赖乃懔?。但畢竟目前技術(shù)水平的人工智能還不能像相對(duì)變數(shù)更少的的圍棋那樣完全駕馭和領(lǐng)悟《星際爭(zhēng)霸2》這款游戲(在筆者之前撰寫的《星際爭(zhēng)霸人工智能alphastar比賽速記》中對(duì)此有詳細(xì)闡述),因此即使有著 200年的學(xué)習(xí)量,今天所展示出的alphastar對(duì)游戲的整體理解能力依然不如只有短短數(shù)年學(xué)習(xí)量的人類強(qiáng)。
以目前的技術(shù)水平來(lái)看,alphastar的技術(shù)提升可能會(huì)存在很大的瓶頸。如果未來(lái)在算法上有較大的技術(shù)進(jìn)步,alphastar可能會(huì)有非常大的學(xué)習(xí)進(jìn)步,那么戰(zhàn)勝人類最強(qiáng)職業(yè)選手或 是為人類啟發(fā)新的《星際爭(zhēng)霸2》打法就真的可以實(shí)現(xiàn)了。
屆時(shí),alphastar自然也就不用再限定死地圖和對(duì)抗種類,也不用再依靠超過人類極限的操作能力,它會(huì)真正意義上的告訴你《星際爭(zhēng)霸2》應(yīng)該怎么玩,會(huì)像alphago那樣告訴人類:你們的地標(biāo)最強(qiáng),在我們看來(lái)只是簡(jiǎn)單電腦;你們公認(rèn)的最優(yōu)玩法,完全就是亂打一通。
4. 你一定會(huì)搞混它們:《星際爭(zhēng)霸2》中的人工智能與腳本
其實(shí)早在alphastar在今天公開打《星際爭(zhēng)霸2》之前,很多星際玩家會(huì)誤以為alphastar是一個(gè)類似于悍馬2000。
悍馬2000是一個(gè)《星際爭(zhēng)霸2》的程序腳本,它能夠?yàn)槿祟愓故救祟惱硐胫凶钔昝赖挠螒虿僮?。比如最廣為人知的散槍兵無(wú)損殺光毒爆、2000只小狗最低損失沖鋒坦克陣。

這類似 于之前我們提到的超出人類生理極限的操作。此類極限的操作是通過提前在程序中寫好了 條件—動(dòng)作 的指令,例如毒爆與槍兵的距離小于某個(gè)閥值的時(shí)候,觸發(fā)槍兵向毒爆運(yùn)動(dòng)的反方向移動(dòng),等等類似指令來(lái)實(shí)現(xiàn)的。
但如果用悍馬2000這樣的腳本和人類進(jìn)行對(duì)決其實(shí)沒有什么實(shí)際的意義,因?yàn)槿祟惖闹R(shí)和理解總是有限的,在有限的知識(shí)下,寫死大量的 條件—動(dòng)作 指令,最后總會(huì)有人類無(wú)法預(yù)知的情況出現(xiàn),腳本bot就會(huì)陷入困境,從而被人類輕松擊敗。而alphastar是學(xué)習(xí)型的,通過大量的對(duì)局自主學(xué)習(xí),優(yōu)化自己的每一次決策,從而提高自己的游戲水平。這樣的人工智能,是能夠做出邏輯推導(dǎo)能力,局勢(shì)分析能力甚至是和對(duì)手的心理、戰(zhàn)術(shù)交互。畢竟《星際爭(zhēng)霸2》是一款即時(shí)戰(zhàn)略游戲。
至于腳本與人工智能的區(qū)別,相信很多朋友已經(jīng)能從上文中理解了,腳本只是寫死的程序,它不能和你來(lái)一次真正意義上的,智能的即時(shí)戰(zhàn)略游戲?qū)?而人工智能會(huì)判斷你的打法,通過對(duì)局勢(shì)的判斷,輸出一個(gè)最有價(jià)值的策略,在人類看來(lái)就是它用了多變的打法來(lái)挑戰(zhàn)你。其實(shí)嚴(yán)格的來(lái)說(shuō),目前以alphastar為代表的頂尖技術(shù)人工智能也是一個(gè)更加高級(jí)復(fù)雜的腳本,它的所有抉擇都是基于相比人類編寫的腳本更加高級(jí)復(fù)雜的推導(dǎo),學(xué)習(xí)與擬合。只是最后打出來(lái)的結(jié)果,以人類的感性視角看來(lái),人工智能具備”獨(dú)立思考能力“。
5. deepmind研究alphastar的意義?
在當(dāng)天在直播結(jié)尾,deepmind提到,alphago通過圍棋戰(zhàn)勝人類是人工智能ai的一個(gè)里程碑。但人類之所以為人類,就是能從不同結(jié)果中學(xué)習(xí),deepmind希望找出能和人類一樣的自我學(xué)習(xí)算法。這個(gè)長(zhǎng)期的計(jì)劃對(duì)于人類在未來(lái)意義重大。

通過挑戰(zhàn)這款每一幀都存在變化、信息不對(duì)等還有其他復(fù)雜條件的游戲,讓人工智能實(shí)現(xiàn)新的技術(shù)突破,最終以寄希望它能用于人類社會(huì)中,造福人類生活。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
