【環球網科技綜合報道】5月16日消息,據外媒報道,谷歌旗下人工智能研發實驗室DeepMind近日宣佈,其開發出一款名爲AlphaEvolve的新人工智能系統,能夠以“機器可分級”的解決方案處理問題,在數學和科學領域展現出獨特價值。
在實驗過程中,AlphaEvolve系統成功幫助優化了谷歌用於訓練其AI模型的部分基礎設施。目前,DeepMind正着手構建與AlphaEvolve交互的用戶界面,並計劃在進行更廣泛推廣之前,先爲選定的學者推出早期訪問計劃。
大多數人工智能模型存在“幻覺”問題,即由於其概率架構,有時會自信地編造信息,較新的模型如OpenAI-o3甚至比上一代更容易出現這一情況,凸顯了該問題的挑戰性。對此,AlphaEvolve引入自動評估系統這一巧妙機制來減少幻覺。該系統會利用模型生成、評估並得出問題的可能答案池,同時自動評估和評分答案的準確性。
需要說明的是,AlphaEvolve並非首個採用此類策略的系統。早在幾年前,包括DeepMind團隊在內的研究人員就已在多個數學領域應用過類似技術。不過,DeepMind強調,AlphaEvolve使用了“最先進的”Gemini模型,這使其能力遠超早期的人工智能實例。
使用AlphaEvolve時,用戶需向系統提出問題,並可選擇包含指令、公式、代碼片段和相關文獻等詳細信息,同時必須提供一種以公式形式自動評估系統答案的機制。由於該系統只能解決能夠自我評估的問題,所以主要處理計算機科學和系統優化等領域的特定類型問題。此外,AlphaEvolve只能將解決方案描述爲算法,這使其不太適合解決非數值問題。
爲對AlphaEvolve進行基準測試,DeepMind讓該系統嘗試了一組精心挑選的約50道數學題,內容涵蓋從幾何到組合學的各個領域。DeepMind稱,AlphaEvolve在75%的情況下能夠“重新發現”這些問題最廣爲人知的答案,並在20%的情況下找到改進的解決方案。
在實際問題評估方面,比如提升谷歌數據中心的效率以及加快模型訓練速度,AlphaEvolve也有出色表現。據實驗室透露,其生成的算法平均可持續回收谷歌全球0.7%的計算資源,還提出了一項優化建議,將谷歌訓練其Gemini模型的總時間縮短了1%。
不過需要明確的是,AlphaEvolve尚未取得突破性發現。在一項實驗中,該系統發現的谷歌TPU AI加速器芯片設計的改進,此前已被其他工具標記過。
儘管如此,DeepMind和許多人工智能實驗室一樣,認爲AlphaEvolve能夠節省時間,讓專家們將精力集中在其他更重要的工作上。(純鈞)