科技觀察:智譜GLM-4.5,這款國產旗艦大模型開源成全球焦點

【環球時報報道 記者 劉揚 胡雨薇】編者的話:中國又一款大模型宣佈開源!此次推出新模型的是曾被美國AI巨頭OpenAI點名的競爭對手中國AI企業智譜。該公司於28日晚正式發佈新一代旗艦大模型GLM-4.5,這是一款專爲智能體應用打造的基礎模型,在複雜推理、代碼生成及智能體交互等通用能力上實現能力融合與技術突破,綜合測試性能已躋身全球領先行列。美國科技網站Techi認爲,中國AI發展正清晰呈現“易獲取”的趨勢:“智譜不僅在追趕深度求索、OpenAI等行業巨頭,更在努力與之同臺競技”。針對這款國產大模型具有哪些最新的特點與突破、爲何要全面開源、此舉對中國大模型發展的影響等話題,《環球時報》記者28日專訪了智譜首席執行官張鵬。

“全球第三、國產第一、開源第一”

中國AI企業智譜28日晚官宣的大模型性能要點如下:新一代旗艦大模型GLM-4.5在包含推理、代碼、智能體等方面的綜合能力達到開源SOTA(意爲“當前最佳技術”或“最前沿水平”);爲綜合衡量模型的通用能力,該研製團隊選擇最具代表性的12個評測基準,在綜合平均分中,GLM-4.5取得了全球模型第三、國產模型第一、開源模型第一。用戶可通過智譜大模型開放平臺使用該模型,其開源版本也將同步登陸Hugging-Face與ModelScope平臺。

這款新模型的發佈,代表了AI發展方向的一次重要轉變。它不再滿足於扮演一個被動回答問題的“聊天機器人”,而是要成爲能夠理解複雜目標、自主規劃並執行多步驟任務的“AI員工”,可以完整執行一些任務。例如,用戶通過該公司網站使用大模型時,僅用一句簡單的指令,就可讓GLM-4.5獨立開發出具備搜索功能的“谷歌”網站、可以發彈幕的“B站”,甚至直接上線一個完整的“Flappy Bird”小遊戲。

據《環球時報》記者瞭解,GLM-4.5和GLM-4.5-Air使用了相似的訓練流程:首先在15萬億token的通用數據上進行了預訓練,此後在代碼、推理、智能體等領域的8萬億token數據上進行鍼對性訓練,最後通過強化學習進一步增強模型推理、代碼與智能體能力。GLM-4.5參數量爲DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標準基準測試中表現得更爲出色,這得益於GLM模型的更高參數效率。

智譜旗艦大模型發佈僅10小時,便引發全球媒體關注。外媒報道普遍聚焦該模型“成本更低、性能更優”的特性,部分媒體還對其參數進行了詳細解析與同類對比。目前該系列模型API調用價格低至輸入0.8元/百萬tokens、輸出2元/百萬tokens;高速版最高可達 100tokens/秒。

28日發佈模型後不到兩個小時,X平臺就在首頁推薦了GLM-4.5這款中國大模型。發佈12小時後,它已經位列國際開源社區Hugging-Face榜單全球第二,創增速紀錄。

美國消費者新聞與商業頻道(CNBC)網站28日稱:“中國企業正在研發的人工智能模型不僅智能化水平提升,使用成本也持續降低,這與深度求索(DeepSeek)當年震動市場的核心突破優勢相呼應。”

印度財經媒體MINT則在報道中評價稱:“GLM-4.5的發佈,正值中國AI初創企業活躍度不斷提升的階段——在這個長期由美國企業主導的領域,衆多中國初創企業正全力提升市場知名度與行業認可度。更強大、更易獲取的模型持續推出,或將爲國內外AI競爭注入新動能。”

路透社28日在報道中提到,作爲中國“AI六小虎”之一的智譜,自今年6月被OpenAI“點名”後便備受關注。彭博社也在當日報道中稱,OpenAI挑戰者智譜AI發佈全新開源模型,試圖在這個蓬勃發展的行業中搶佔制高點,爲未來技術進步樹立行業標準。另一家美國知名科技媒體VentureBeat則在報道中提到:“GLM-4.5的發佈爲企業團隊提供了一個可行的、高性能的基礎模型。對於平衡創新、績效和運營限制的團隊來說,這是一個令人信服的選擇。”印度媒體Data Request的報道稱:“這家脫胎於清華大學的企業持續拓展通用語言模型(GLM)系列,旨在讓先進AI技術更易獲取。這標誌着人工智能系統向更高自主性邁出了重要一步。進一步鞏固了其作爲OpenAI等全球玩家競爭對手的地位。”美國科技網站Techi認爲,隨着更多企業推出開源模型並壓低價格,中國正逐步成爲全球AI競爭的核心參與者,力爭佔據領先地位。未來幾個月,這些快速變化將帶來何種影響——是催生新的監管政策,還是推動新的技術創新,仍有待觀察。

除了智譜旗艦大模型的性能,美國媒體還對中國AI產業界在世界人工智能大會期間的重大舉措保持關注。美國CNBC網站28日另一篇文章稱,中國人工智能公司日前宣佈成立兩家新的產業聯盟,旨在發展國內生態系統,減少對外國技術的依賴,以應對美國對先進芯片出口的限制。

“中國開源大模型浪潮的一部分”

受到外界高度關注的除了這款國產大模型的性能,還有一個亮點就是本次將旗艦模型以最高開放協議MIT協議進行全面開源的態勢。爲什麼要選擇在這個節點進行全面開源?開源策略又將對中國國產大模型的未來發展帶來哪些深刻影響?

智譜首席執行官張鵬28日接受《環球時報》記者專訪時表示,智譜是國內最早進行大模型開源的AI企業之一,曾多次進行大模型開源。2022年,該公司曾把千億基座模型開源,當時在全球引起廣泛關注,包括蘋果、OpenAI在內的全球頭部企業紛紛下載進行對比分析。2023年初,ChatGPT開始流行時,智譜又開源了一個6B的模型,可以直接在筆記本電腦運行。之後,更多國內企業開始嘗試用開源策略,公衆也對開源有了更多的瞭解。

談到此次開源出於哪些考量,張鵬表示,首先,從學術界和國家戰略來講,開源都是一個非常重大的戰略方向。其次,從企業來講,每次開源時間節點的選擇都有一些特殊考量,“我們認爲在這個時間點上開源,可以促進產業界、學術界重新思考AI的發展,重新思考AGI(通用人工智能)的前景,甚至探尋下一個新的計算範式。”

多家國外科技類網站將智譜此次全面開源看作是“中國開源大模型浪潮的一部分”。美國科技媒體VentureBeat28日的文章稱,GLM-4.5的發佈正值中國開源模型競爭激烈的時期,其中最引人注目的是阿里巴巴Qwen團隊的模型。在短短几天內,Qwen發佈了4個新的開源大語言模型,其中包括專注於推理的版本,目前在多項推理基準測試中,已經超越或追平了OpenAI的o4-mini和谷歌的Gemini 2.5 Pro等先進模型。

7月28日晚,繼上週三連發後,阿里巴巴又推出新的開源模型——電影級視頻生成模型通義萬相Wan2.2。

下一個範式:成爲“全優生”

一些西方媒體總是試圖給智譜貼上“中國的OpenAI”等標籤,這家中國AI企業與美國OpenAI公司發展路徑和思路有哪些異同之處?

張鵬表示,第一個相似點是雙方都在各自國家較早地開始訓練大模型。OpenAI成立後,於2018年開始訓練大模型,最早也是產學研結合,很多斯坦福的學生在OpenAI做研究。智譜2018年從清華孵化出來,2019年研究大模型方向,到2020年訓練第一個模型,比OpenAI晚了一些,但在國內是最早的。張鵬提到:“2020年我們訓練模型的時候,國內好多人不理解,爲什麼非得訓練一個百億、千億級的通用模型?當時國內還是倡導訓練小模型,一個億參數就可以做特定任務。”

第二個相似點是雙方都努力探索不同方向的能力邊界。“大家都不知道人工智能的邊界到底在哪裏。OpenAI在2023年後探索了很多方向,比如o系列模型。我們也在探索各種各樣的模型,例如我們此次發佈的首個原生融合模型,就代表行業一個新的發展方向。”他介紹說,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精於數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5 正是朝着統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。大模型的下一個範式,一定是把各種能力整合到一起,成爲一個“全優生”,就像人一樣,擁有越來越通用的能力。

張鵬表示,到今天,全球AI頭部企業可能慢慢也在達成一定的共識。首先,基座模型是非常重要的,“我覺得這一點上我們跟OpenAI有共通之處。但也有一些不一樣的點,我們不像OpenAI那樣全封閉,而是用開放的思路發展科學、發展技術,帶動產學研合作,在我們最強的基座模型方面,專注於讓它的能力不斷提升。”

探尋AI能力上限

美國日前剛公佈了被外界稱爲“AI版星球大戰”的“AI行動計劃”,它可能會對中美AI競爭格局以及全球AI發展帶來怎樣的影響?

張鵬表示,從某種角度來看,美國這種強化自身AI領域優勢的策略與思路,延續之前的“星際之門”,加大國家級的重投入,這可能會催生一種新的競爭。另一方面,AI發展到今天,本質還是在探索AGI的能力上限,甚至沒有辦法提前預知要投入多少成本。如果我們不努力,就要面臨被落下的風險。但參與這種競爭,成本又比較大。這確實考驗整體戰略:應該花多大力氣制定一個什麼樣的方案,並且能夠讓產學研的人員都加入其中,一起瞄着AI能力上限去努力。

對於智譜的發展願景,張鵬認爲,未來首先要增強對於AGI技術發展方向的認知,保持對AGI未來態勢的關注,而不是隻關注眼前。第二個就是探索智能的上限,並且在探索能力上限的過程中,找到什麼是AI真正的應用場景。

張鵬認爲,從算法的角度看,下一個AI的範式能不能踩中,是不是第一個提出來的,是智譜在整個發展路徑上必須關注的事情。“與全球科學家一起探索科學邊界,以及爲滿足中國AI發展需求做一些正確的事情,這是我們對未來發展的一個定位。”



Scroll to Top