通義千問開源320億參數模型,已實現7款大語言模型全開源

【環球網報道 記者 李文瑤】4月7日消息,阿里雲通義千問開源320億參數模型Qwen1.5-32B,可最大限度兼顧性能、效率和內存佔用的平衡,爲企業和開發者提供更高性價比的模型選擇。目前,通義千問共開源了7款大語言模型,在海內外開源社區累計下載量突破300萬。

據瞭解,通義千問此前已開源5億、18億、40億、70億、140億和720億參數的6款大語言模型並均已升級至1.5版本,其中,幾款小尺寸模型可便捷地在端側部署,720億參數模型則擁有業界領先的性能,多次登上HuggingFace等模型榜單。此次開源的320億參數模型,將在性能、效率和內存佔用之間實現更理想的平衡,例如,相比14B模型,32B在智能體場景下能力更強;相比72B,32B的推理成本更低。通義千問團隊希望32B開源模型能爲下游應用提供更好的解決方案。

通義千問是阿里雲研發的一款超大規模預訓練語言模型,能夠進行多輪對話、文案創作、邏輯推理、多模態理解及多語言支持等功能。阿里雲於2023年9月13日正式將通義千問模型對外開放使用,可應用於客戶服務、在線教育、內容創作、智能搜索等諸多領域,通過與用戶進行自然對話的方式提供幫助和服務。



Scroll to Top