新AI玩策略類遊戲有超人表現

【總編輯圈點】

科技日報北京11月19日電 (記者劉霞)谷歌“深度思維”公司開發出一款名爲“遊戲學生”(SoG)的新人工智能(AI)工具,能在國際象棋、圍棋、撲克和其他需要多種策略才能獲勝的遊戲中擊敗人類玩家。“深度思維”公司表示,最新研究朝着能以超人的表現執行多項任務的通用AI邁出了重要一步。相關論文發表於最新一期《科學進展》雜誌。

SoG模型源於兩個項目:一是首個在撲克中擊敗人類職業玩家的AI程序DeepStack,其由加拿大阿爾伯塔大學研究團隊創建;另一個是“深度思維”公司創建的AlphaZero,其在國際象棋和圍棋等遊戲中擊敗了最優秀的人類玩家。

這兩個模型之間的區別在於:一個模型關注的是不完美的知識遊戲,也就是玩家不知道所有其他玩家的狀態,比如撲克遊戲中其他玩家的牌;而另一個模型則關注的是國際象棋這樣的完美知識遊戲,玩家可隨時看到所有棋子的位置。這兩種遊戲所需要的策略大相徑庭。“深度思維”僱傭了DeepStack團隊,建立了一個通用模型,SoG應運而生。

研究人員在國際象棋、圍棋、得州撲克和一種名爲“蘇格蘭場”的桌游上測試了SoG,發現它可擊敗幾款現有的AI模型和最優秀的人類玩家。研究人員表示,SoG應該也能學會玩其他遊戲。SoG會先開始學習如何玩遊戲,然後通過實踐改進並教會自己如何與另一個版本的自己比賽,在此過程中學習新策略,增強自己的能力,使其更具通用性。

上世紀90年代,計算機“深藍”戰勝人類國際象棋大師時,曾引起很大轟動。前幾年,谷歌旗下的AlphaGo機器人戰勝人類圍棋選手,也廣受關注。如今,人工智能程序已“進化”到可以在多種遊戲中擊敗人類。但是,看到這樣的新聞,反而不再那麼震驚了。原因在於,我們已逐漸認識到,對於有邏輯、有規則、可計算的事物,人工智能的確有其過人之處。與此同時,人類也有許多特徵,如道德、情感、關懷、創意等,是人工智能仍遠遠無法企及的。



Scroll to Top