【環球網科技報道 記者 秦耳】年之過半,進入六月。對於AI大模型而言,隨着年初GPT-o3發佈,以及4月GPT-4o帶動起全球熱議的“吉卜力畫風”。雖然期待已久的GPT-5依然遲遲未能上線,o3與4o的能力已經讓業界意識到大模型已經從單純的文本訓練,進入了真正“多模態”。
在多模態大模型技術支撐下,今年市場上各類Agent產品創新也如“雨後春筍”,今年年初在網絡上爆火的由蝴蝶效應公司發佈的Manus就是一款多用途的Agent。在五月OpenAI收購知名硬件設計公司io進軍AI硬件,以及宇樹科技CEO王興興近期在接受採訪中講出“人形機器人更需要智力”的論斷。可以說,今年對業界而言是真正的“Agent元年”。
爲了進一步瞭解大模型技術發展與應用,在2025北京智源大會之際,記者採訪到智源研究院院長王仲遠,闡釋了他對於大模型技術以產品化的看法。值得一提的是,在去年2024北京智源大會上,王仲遠院長預測到2025年我國大模型整體能力將達到GPT-4的水平,同時2025年將開啓產品化。從現在這個時間點看,這個預測得到了證實。
對於大模型的發展,王仲遠認爲,過去一年大模型整體的發展方向在於強化學習以達到訓練和推理上的提升。包括GPT-o3、DeepSeek R1等都是這方面的代表。現在大模型Scaling Law依然成立,目前已經實現利用多模態數據,如果進一步實現人工智能合成的數據、生成的數據質量能夠達到人類創造的數據質量,那意味着人工智能有可能實現自我學習和進步。
即便在當前大模型能力的推動下,宏觀層面,大模型與硬件結合,通過具身智能的發展解決實際生產生活問題已經成爲可能。
“大模型發展到一定程度,達到可用狀態之後,Agent是產業界可以開始發力的領域。基礎大模型達到可用狀態時,像水、電、操作系統一樣,意味着可以基於這個操作系統開發很多相當於移動互聯網的APP的Agent。”王仲遠認爲。
他認爲,Agent是技術和產業發展趨勢之一,隨着基礎大模型技術進一步發展以及Agent產品化不斷成熟,大模型或可在Agent上出現“殺手級”應用。
不過,王仲遠同時表示,基礎大模型一定會收斂,現在可以看到行業內剩下少數幾個玩家在堅持基礎大模型。側面上也傳遞出,創業公司在進入Agent領域一定要進入專業領域,而不是通用領域。
今後,在Agent上會出現一人創業公司或者少數幾個人組成的創業公司,如果對領域非常瞭解,對領域的用戶需求非常瞭解,就有機會創造出這個領域獨特的基於大模型的產品和體驗,進入到一個新的階段。
基於對大模型發展的判斷,在今年智源大會上,智源正式推出“悟界”,圍繞物理AGI所做的大模型最新科研成果和佈局構成了“悟界”系列大模型。“悟界”系列大模型目前包含四個模型:原生多模態世界模型Emu3、全球首個腦科學多模態通用基礎模型見微Brainμ、具身大腦RoboBrain 2.0以及全原子微觀生命模型OpenComplex2。
其中,RoboBrain 2.0 作爲開源具身大腦大模型,在任務規劃上基於多本體 - 環境動態建模實現多機協同規劃,準確率較 1.0 提升 74%;空間智能性能提升 17% 並新增空間推理能力;還具備閉環反饋與深度思考能力,可實時調整策略、分解複雜任務;其與 RoboOS 2.0 已全面開源核心資源,助力產業發展,目前智源研究院已攜手 20 多傢俱身智能企業共建協同生態 。
面對人工智能已經進入產業爆發期的“拐點”時刻,作爲研究院,王仲遠認爲包括政府等職能部門,需要對產業發展包容審慎,看到技術快速發展的階段和落地的現實情況。要辯證看待產業發展中的風險,產業發展中的問題可以規範化。而不是“因噎廢食”,因爲問題而不發展產業;同時,給企業創造好的環境,讓大企業或者小企業有很好的創新創業環境,也給科研機構和高校更多的支持和探索空間。新型研發機構、高校和企業,大家各自做好各自的事情,社會的創新體系自然而然就會爆發。