谷歌 DeepMind 發佈編程 AI Agent AlphaEvolve,攻克300年數學難題

【環球網科技綜合報道】5 月 14 日,谷歌 DeepMind 在官網宣佈推出用於設計高級算法的編程 AI Agent——AlphaEvolve。據介紹,這款 AI Agent 與谷歌的大模型 Gemini 深度集成,能夠自動評估通用算法的發現與優化,助力開發人員高效設計出優質、高效的矩陣算法。簡單來說,大模型善於生成各類想法和算法,而 AlphaEvolve 則如同 “質檢員”,依據特定標準判斷這些想法的可行性。

爲展現 AlphaEvolve 的能力,谷歌選擇讓其挑戰一道有着 300 多年曆史的數學難題 —— 親吻數問題。該問題最早可追溯至1694 年,牛頓也曾參與辯論和研究。其難點在於確定在給定維度的空間中,最多能有多少個相同大小的球體同時與一箇中心球體接觸,且這些球體之間不會發生重疊。而 AlphaEvolve 成功發現了由 593 個外層球體組成的結構型,在 11 維空間中建立了新的下界,超越了此前數學家們創造的紀錄。

此外,AlphaEvolve 還能針對複雜數學問題提出創新性解決方案。基於極簡代碼框架,它設計出了一種基於梯度的新型優化程序的諸多組件,並發現了多種用於矩陣乘法的新算法。例如,它找到了一種用於 4x4 復值矩陣乘法的算法,僅需 48 次標量乘法,改進了 Strassen 在 1969 年提出的算法,而 Strassen 算法此前被認爲是該場景下的最佳算法。

據介紹,在實際應用方面,AlphaEvolve 通過將大規模矩陣乘法運算拆解爲更易處理的子問題,使 Gemini 模型架構中的核心計算效率提升了 23%,整體訓練時間縮短了 1%,有效節省了大量成本。同時,它還能對 GPU 底層指令進行優化,在基於 Transformer 的人工智能模型中,實現了 FlashAttention 核心計算最高達 32.5% 的加速。

谷歌DeepMind 研究員 Matej Balog 在接受外媒 VentureBeat 採訪時提到:“AlphaEvolve 可以發現極其複雜的算法 —— 跨越數百行代碼,擁有遠遠超出簡單函數的複雜邏輯結構。”

目前,谷歌 DeepMind 正在與 People+AI 研究團隊合作,開發與 AlphaEvolve 交互的友好用戶界面,並計劃爲選定的學術用戶推出早期訪問計劃。(青山)



Scroll to Top