新AI玩策略類遊戲有超人表現-科技-極速新聞-每日看看

新AI玩策略類遊戲有超人表現

2023-11-20 09:17 由科技日報發佈於科技 335

【總編輯圈點】

科技日報北京11月19日電（記者劉霞）谷歌“深度思維”公司開發出一款名爲“遊戲學生”（SoG）的新人工智能（AI）工具，能在國際象棋、圍棋、撲克和其他需要多種策略才能獲勝的遊戲中擊敗人類玩家。“深度思維”公司表示，最新研究朝着能以超人的表現執行多項任務的通用AI邁出了重要一步。相關論文發表於最新一期《科學進展》雜誌。

SoG模型源於兩個項目：一是首個在撲克中擊敗人類職業玩家的AI程序DeepStack，其由加拿大阿爾伯塔大學研究團隊創建；另一個是“深度思維”公司創建的AlphaZero，其在國際象棋和圍棋等遊戲中擊敗了最優秀的人類玩家。

這兩個模型之間的區別在於：一個模型關注的是不完美的知識遊戲，也就是玩家不知道所有其他玩家的狀態，比如撲克遊戲中其他玩家的牌；而另一個模型則關注的是國際象棋這樣的完美知識遊戲，玩家可隨時看到所有棋子的位置。這兩種遊戲所需要的策略大相徑庭。“深度思維”僱傭了DeepStack團隊，建立了一個通用模型，SoG應運而生。

研究人員在國際象棋、圍棋、得州撲克和一種名爲“蘇格蘭場”的桌游上測試了SoG，發現它可擊敗幾款現有的AI模型和最優秀的人類玩家。研究人員表示，SoG應該也能學會玩其他遊戲。SoG會先開始學習如何玩遊戲，然後通過實踐改進並教會自己如何與另一個版本的自己比賽，在此過程中學習新策略，增強自己的能力，使其更具通用性。

上世紀90年代，計算機“深藍”戰勝人類國際象棋大師時，曾引起很大轟動。前幾年，谷歌旗下的AlphaGo機器人戰勝人類圍棋選手，也廣受關注。如今，人工智能程序已“進化”到可以在多種遊戲中擊敗人類。但是，看到這樣的新聞，反而不再那麼震驚了。原因在於，我們已逐漸認識到，對於有邏輯、有規則、可計算的事物，人工智能的確有其過人之處。與此同時，人類也有許多特徵，如道德、情感、關懷、創意等，是人工智能仍遠遠無法企及的。