1月9日,百川智能發佈角色大模型Baichuan-NPC,深度優化了“角色知識”和“對話能力”,使模型能夠更好的理解上下文對話語義,更加符合人物性格地進行對話和行動。此外,對於遊戲領域AI角色開發成本高、週期長、自由度差、API不穩定等諸多不足, 百川智能推出了“角色創建平臺+搜索增強知識庫”的定製化解決方案。通過這一方案,遊戲廠商無需編寫代碼,只需通過簡單的文字描述,便可以快速構建出自己需要的角色,實現低成本、高效率的角色定製。

大模型強大的生成能力、流暢的自然交互方式,將改變遊戲的開發流程,重構遊戲體驗已成爲業內共識。但如何將大模型這個新技術融入成熟的遊戲研發流程,依舊挑戰重重。其中目前最大的問題是,當下的大模型在角色扮演上依舊“不夠擬人”,這會直接破壞用戶與角色的互動感受,使遊戲喪失沉浸感。
模型在角色扮演中是否足夠“擬人”,主要由模型的基礎能力和角色扮演一致性兩個方面來決定。
對於角色扮演而言,模型的基礎能力既包括模型的通用智能水準,還包含角色知識、對話能力、情節演繹以及邏輯推理四個專項能力。而強化這些能力的最佳方式是在預訓練階段通過高質量數據集進行鍼對性訓練。
對此,百川智能收集了海量行業網站、高質量書籍、優質劇本數據,對Baichuan-NPC進行了超過3T Tokens的領域知識預訓練。此外,Baichuan-NPC還創新性地使用多方法模型合成數據進行預訓練階段的領域知識增強,針對性地緩解了Reversal Curse問題,大幅度提升Token利用效率。
角色扮演一致性問題指的是,通用語言模型在角色“演繹”過程中,非常容易跳出“角色設定”變回“智能助手”或做出不符合角色人設的言行,即業界所說的OOC問題(角色言行偏離原有設定,如:古代人物談論現代事物)。
針對這一問題,百川智能首創將思維鏈對齊技術引入到角色模型對齊中。使用帶有思維鏈的數據構造方式和帶有思維鏈對齊的強化對齊方法,雙管齊下讓模型的思考過程和思考之後的行動表現更接近人類,大幅提升了角色一致性,顯著增強模型的基礎對話能力和角色演繹能力。
將大模型的角色構建能力應用於具體場景,除了模型要具備強大的基礎能力,簡潔高效的開發流程同樣至關重要。當前行業內的角色構建主要通過API調用實現。在實際創作中,需要產品、運營、技術等多個部門共同協作、反覆調試,開發流程門檻高、週期長、效率低,最終的角色效果還難以保障。
對此,百川智能在Baichuan-NPC基礎上推出了由“角色創建平臺+搜索增強知識庫”組成的開發套件,通過標準化模板、自定義選項、所見即得的調優界面及搜索增強知識庫,爲用戶提供了一個高度自由且無需編寫代碼的低成本解決方案。
AI角色知識儲備量是決定能否自由定製角色的另一個重要因素。如果AI角色缺乏與其身份相符的知識,即使角色“演繹”的再努力,也會讓人感覺“不真實”。
百川智能將搜索技術與角色知識能力深度融合,基於最新研發的SOTA模型BCTE(Baichuan-Text-Embedding),針對角色扮演場景優化了建庫和召回算法,爲角色和知識庫提供了靈活的“多對多”關聯方式。用戶只需上傳角色所需的知識文檔並自定義回覆方式,就能顯著降低角色產生幻覺的可能性,極大地豐富了角色“內涵”。
創建好角色只是完成了角色定製的第一步,想要真正落到真實場景,還需要微調優化讓其達到最佳效果。百川角色創建平臺將微調選項和角色對話效果實時整合,實現了調優過程的“所調即所見”。
此外,平臺還提供了一鍵複製功能。完成角色調試後,用戶可以在查看代碼頁面一鍵複製全部角色代碼,然後將角色代碼集成到業務場景中。這種“所調即所得”的方式,極大降低了開發門檻,有效縮減了企業定製角色的時間和人員成本。
據悉,目前,百川智能已經與衆多泛娛樂行業的頭部品牌建立了深度合作關係,共同拓展AIGC創作的應用場景。