DeepMind推出新型AI工具AlphaEvolve 助力解決數學與科學問題-科技-極速新聞-每日看看

DeepMind推出新型AI工具AlphaEvolve 助力解決數學與科學問題

2025-05-16 13:56 由環球網發佈於科技 121

【環球網科技綜合報道】5月16日消息，據外媒報道，谷歌旗下人工智能研發實驗室DeepMind近日宣佈，其開發出一款名爲AlphaEvolve的新人工智能系統，能夠以“機器可分級”的解決方案處理問題，在數學和科學領域展現出獨特價值。

在實驗過程中，AlphaEvolve系統成功幫助優化了谷歌用於訓練其AI模型的部分基礎設施。目前，DeepMind正着手構建與AlphaEvolve交互的用戶界面，並計劃在進行更廣泛推廣之前，先爲選定的學者推出早期訪問計劃。

大多數人工智能模型存在“幻覺”問題，即由於其概率架構，有時會自信地編造信息，較新的模型如OpenAI-o3甚至比上一代更容易出現這一情況，凸顯了該問題的挑戰性。對此，AlphaEvolve引入自動評估系統這一巧妙機制來減少幻覺。該系統會利用模型生成、評估並得出問題的可能答案池，同時自動評估和評分答案的準確性。

需要說明的是，AlphaEvolve並非首個採用此類策略的系統。早在幾年前，包括DeepMind團隊在內的研究人員就已在多個數學領域應用過類似技術。不過，DeepMind強調，AlphaEvolve使用了“最先進的”Gemini模型，這使其能力遠超早期的人工智能實例。

使用AlphaEvolve時，用戶需向系統提出問題，並可選擇包含指令、公式、代碼片段和相關文獻等詳細信息，同時必須提供一種以公式形式自動評估系統答案的機制。由於該系統只能解決能夠自我評估的問題，所以主要處理計算機科學和系統優化等領域的特定類型問題。此外，AlphaEvolve只能將解決方案描述爲算法，這使其不太適合解決非數值問題。

爲對AlphaEvolve進行基準測試，DeepMind讓該系統嘗試了一組精心挑選的約50道數學題，內容涵蓋從幾何到組合學的各個領域。DeepMind稱，AlphaEvolve在75%的情況下能夠“重新發現”這些問題最廣爲人知的答案，並在20%的情況下找到改進的解決方案。

在實際問題評估方面，比如提升谷歌數據中心的效率以及加快模型訓練速度，AlphaEvolve也有出色表現。據實驗室透露，其生成的算法平均可持續回收谷歌全球0.7%的計算資源，還提出了一項優化建議，將谷歌訓練其Gemini模型的總時間縮短了1%。

不過需要明確的是，AlphaEvolve尚未取得突破性發現。在一項實驗中，該系統發現的谷歌TPU AI加速器芯片設計的改進，此前已被其他工具標記過。

儘管如此，DeepMind和許多人工智能實驗室一樣，認爲AlphaEvolve能夠節省時間，讓專家們將精力集中在其他更重要的工作上。（純鈞）