智譜AI推出第三代基座大模型ChatGLM3

10月27日,智譜AI在2023中國計算機大會(CNCC)上推出了全自研的第三代基座大模型ChatGLM3及相關係列產品。此次推出的ChatGLM3採用了獨創的多階段增強預訓練方法,使訓練更爲充分。

智譜AI CEO張鵬在現場做了新品發佈,並實時演示了最新上線的產品功能。據介紹,通過更豐富的訓練數據和更優的訓練方案,智譜AI推出的ChatGLM3性能更加強大。與ChatGLM2相比,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。

同時,ChatGLM3瞄向GPT-4V本次實現了若干全新功能的迭代升級,包括多模態理解能力的CogVLM-看圖識語義,在10餘個國際標準圖文評測數據集上取得SOTA;代碼增強模塊Code Interpreter根據用戶需求生成代碼並執行,自動完成數據分析、文件處理等複雜任務;網絡搜索增強WebGLM-接入搜索增強,能自動根據問題在互聯網上查找相關資料並在回答時提供參考相關文獻或文章鏈接。ChatGLM3的語義能力與邏輯能力得到了極大的增強。

ChatGLM3還集成了自研的AgentTuning技術,激活了模型智能體能力,尤其在智能規劃和執行方面,相比於ChatGLM2提升了1000% ;開啓了國產大模型原生支持工具調用、代碼執行、遊戲、數據庫操作、知識圖譜搜索與推理、操作系統等複雜場景。

此外,ChatGLM3本次推出可手機部署的端測模型ChatGLM3-1.5B和 ChatGLM3-3B,支持包括vivo、小米、三星在內的多款手機以及車載平臺,甚至支持移動平臺上CPU芯片的推理,速度可達20 tokens/s。精度方面1.5B和3B模型在公開benchmark上與ChatGLM2-6B模型性能接近。

基於最新的高效動態推理和顯存優化技術,ChatGLM3當前的推理框架在相同硬件、模型條件下,相較於目前最佳的開源實現,包括伯克利大學推出的 vLLM 以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens僅0.5分。



Scroll to Top