聚焦新質生產力系列之六:從算力到存力,解鎖數據要素新價值

【環球網科技報道 記者 張陽】在數字化浪潮以排山倒海之勢席捲全球的當下,數據已成爲驅動社會進步和產業變革的核心要素,其規模正以指數級的速度瘋狂增長。特別是隨着人工智能(AI)技術的逐步成熟,大模型技術成爲科技領域發展的核心熱點,決定大模型發展快慢的“算力”,成爲街頭巷尾的熱議話題,而對於“存力”話題卻讓很多人感到茫然。

所謂“存力”也即數據存儲能力,隨着全球數據量以36%的年增長率持續擴張,預計到2030年將達到YB級規模,如何高效、安全地存儲這些海量數據,成爲了讓算力將人工智能大模型發揮其應有效力的前提。因爲也有評論認爲“算力決定人工智能的底線,數據決定人工智能的上限”。而根據工業和信息化部等六部門印發的《算力基礎設施高質量發展行動計劃》認爲,算力是集信息計算力、網絡運載力、數據存儲力於一體的新型生產力。在這一背景下,算力與存力作爲數據價值釋放的“雙引擎”,正成爲新基建競爭的戰略制高點。

近日,爲了更好探究我國存力發展現狀、挑戰及未來趨勢,中國信息通信研究院組織的“存力中國行”活動正式啓動,首站走進廣東,爲行業搭建了深度交流的平臺。

“存力中國行”走進廣東,透視存力發展現狀

廣州華銀康醫療集團股份有限公司(簡稱華銀康集團)是以病理爲核心的獨立醫學檢驗與診斷服務企業。作爲國內病理服務的先行者,華銀康集團於2010年開始,與國內外多所重點院校共同建設“華銀康病理診斷中心”。目前已建立覆蓋31個省區的醫學實驗室網絡,全國服務客戶超過12800家,其中與近700家醫療機構共建高水平病理科。

華銀康集團圍繞智慧病理的發展持續佈局,依託“數據-算法-場景”全鏈路技術閉環,在行業內首創“AI+系統+設備+資源”四位一體服務模式,提供模塊化智慧病理解決方案。在233位病理專家團隊及100位標註專家的支持下,深度融合DeepSeek等大模型技術,在遠程病理的基礎上爲各級醫療機構提供數字病理數據庫打造、病理AI輔助診斷、病理結構化報告以及病理全流程管理監控等服務。

以胃活檢爲例,胃活檢診斷具有極高的複雜性,對於處在病情發展中或少量異型細胞存在的情況,模型可通過提示性文字和對應區域展示,針對非明確的散落的可疑異型細胞進行建議性提示。系統針對於胃癌的敏感性超過99%,特異性達90%,有效防止漏診與誤診。通過AI分析後,會輸出整體診斷建議、熱力圖及色階圖,幫助醫生快速定位可疑病變區域,最終由病理醫生完成診斷。

華銀康在發展過程中遇到的一大難題就是數據存儲,全集團年檢測標本量約4000萬例,每一張完整病理圖像都需要近1GB存儲空間,同時還要保障能夠快速調用這些圖片供AI與病理醫生進行分析診斷,如果全部完整使用、歸檔所需要的存儲空間以及設備成本將是一個天文數字。所以華銀康採用了切片方式對病理圖像數據進行處理,僅保留病竈部位的圖像切片,並且採用了華爲分佈式存儲系統,構建安全、高效、可擴展的先進存力,並通過高效的壓縮技術降低存儲空間壓力,儘管如此,集團的機房內每年需要擴展的存儲容量仍然在PB級別。

數據要素化催生存力新基建

華銀康集團面臨的難題可以說是AI時代發展的縮影,隨着人工智能的爆發式增長和數據總量的指數級躍升,存儲已從傳統的“數據容器”躍遷爲支撐數字經濟高質量發展的戰略基座,是激活數據要素價值、培育新質生產力的核心引擎。

中國信通院副院長王志勤介紹,我國存力建設取得顯著成效,截至2024年底,全國存力總規模已達1580EB,先進存儲佔比提升至28%。然而,仍面臨“存而不用、用而不深”、核心芯片、軟件、介質短板以及存算運協同效率待提升等挑戰。爲此,她提出三大建議:探索最優路徑,共享最佳實踐;聚焦存力服務普惠與效能提升;強化技術攻關與產業協同生態構建。

華爲數據存儲產品線戰略與業務發展部總裁王旭東對此也深表認同。王旭東在接受記者專訪時開門見山地指出:“AI時代是數據的黃金時代,更是算力與存力協同進化的時代。”當DeepSeek等大模型引發產業變革後,數據已從“沉睡資產”蛻變爲驅動產業發展的核心生產要素。然而當前我國數據發展面臨雙重矛盾,記者採訪王旭東瞭解到:一方面2024年全國數據生產總量達41.06ZB,同比增長25%,但存儲總量僅2.09ZB,數據留存率不足5.1%;另一方面存儲數據中一年內未使用的“冷數據”逐年增多,傳統架構下數據孤島問題嚴重,導致數據治理效率低下。

這種矛盾在技術層面表現得尤爲突出。隨着AI進入多模態時代,文本、視頻、圖像等異構數據融合需求激增,傳統網絡架構已難以支撐。王旭東以醫療行業爲例:“醫院在構建AI大模型時,非結構化醫學影像數據的標註成本極高,傳統方式下數據準備週期長達數月。”這正是存力中心建設如火如荼的核心原因——它通過規模聚數、高效治數、安全供數、產業用數四個維度,構建起數據從資源到資產的閉環體系,與算力基礎設施形成互補,共同破解“數據豐富但價值貧瘠”的產業困境。

政策層面的驅動同樣顯著。國家數據局、工信部等部委密集出臺政策,將存力列爲重點發展方向,明確提出推動行業和區域數據歸集平臺建設。在“東數西算”工程中,廣東韶關、貴州、京津冀廊坊等樞紐節點同步規劃存力中心,使其不僅成爲數據存儲載體,更升級爲省級備份災備中心、行業語料庫開發基地和產業聚集中心。“政策與技術的雙重驅動,讓存力中心從概念走向落地,成爲激活數據要素價值的關鍵基礎設施。”王旭東強調。

從數據匯聚到產業賦能的全鏈條創新

王旭東告訴記者,在華爲的實踐中,存力中心的價值釋放依託四大核心能力體系,形成了一套可複製的 “華爲方案”。

規模聚數:打破數據孤島的全局掌控力。面對跨區域、跨行業的數據匯聚挑戰,華爲Omni-Dataverse通過三大創新實現數據全局可視、可管、可用:一是建立統一數據視圖,解決“數據在哪裏”的認知難題,實現資產註冊0遺漏、更新0等待;二是依託智能數據目錄,對百億級數據進行自動標籤,支持秒級查找;三是構建自定義數據流通機制,用戶可根據需求設定跨區域、跨設備的共享策略。

高效治數:AI 時代的數據質量鍛造廠。“AI大模型的競爭力高度依賴高質量數據集。”王旭東以華爲AI全流程工具鏈ModelEngine爲例,闡述華爲如何通過數據使能、模型使能、應用使能三方面提升數據治理效率。在瑞金醫院病理大模型項目中,基於此工具將病理數據標註週期縮短80%,大幅降低了AI模型上線成本。更重要的是,ModelEngine覆蓋了“數據預處理-模型訓練-應用部署”全流程,使單癌種業務AI應用上線週期縮短80%,爲醫療、製造等行業的模型落地提供了加速器。

安全供數:數據流通的可信防護網。數據要素流通的前提是安全可信。華爲構建的軟硬一體可信數據空間,從技術與管理雙維度保障數據流動:技術上採用可信流通策略、芯片級安全保障和端到端傳輸加密;管理上建立30+數據控制策略,實現全流程日誌審計。“就像給數據敷上‘保護膜’,讓提供方和使用方都能放心。”王旭東提到,這種安全體系不僅滿足合規要求,更解決了龍頭企業數據共享的核心顧慮——在醫療領域,通過所有權與使用權隔離技術,已推動多家三甲醫院實現數據安全共享。

產業用數:海量數據規模集聚融合之後,要推動“數據+行業+場景”的深度融合,形成數據從採集到治理到應用的正循環。王旭東透露,在某汽車廠商場景中,該企業不僅依託存力中心匯聚了企業內部數據,還整合了城市、金融、充電樁等外部數據,爲後續該企業的數據應用服務奠定基礎,併爲政府部門提供體系化監管服務支撐。

從介質突破到生態協同的破局之路

儘管存力中心發展前景廣闊,王旭東也坦誠指出當前產業面臨的三大核心挑戰:“國內80%以上的數據仍存儲在機械硬盤,而該領域核心技術長期不在國內。”王旭東呼籲加速全閃存介質的應用與創新,他強調:“發展存力產業必須構建自主可控的產業鏈,從芯片到整機再到應用,形成完整的技術生態,這既是安全需求,也是產業升級的必然路徑。”

AI應用對存儲提出了全新要求:千億級參數模型訓練需要極致性能支撐,邊緣推理場景需要長記憶存儲能力。華爲通過存算協同架構,在訓練場景中使AI集羣利用率提升30%,在推理場景中實現數據吞吐量提升60%。王旭東建議:“應將AI存儲納入國家關鍵技術規劃,推動行業標準制定,通過技術創新提升我國在全球高端存儲領域的競爭力。”

當前我國數據災備覆蓋率僅爲34%,遠低於發達國家水平,且開源軟件依賴度高,存在安全隱患。華爲推出的“兩地三中心”災備方案,業務故障時可實現分鐘級切換,同時通過自研存儲操作系統降低對開源組件的依賴。“數據安全是存力中心的生命線,需要政策引導、技術創新和生態協同多管齊下,構建自主可控的安全底座。”王旭東總結道。

“就像電力改變工業時代一樣,存力將定義AI時代的產業新秩序。”王旭東認爲,存力中心將從三個維度重塑產業格局:在技術層面,存儲設備不僅是數據容器,更將進化爲數據處理中心;在產業層面,以存力中心爲樞紐,將形成數據採集、治理、交易、應用的完整產業鏈,催生數據服務商、AI訓練師等新興職業;在社會層面,數據將像水電一樣成爲公共資源,通過存力中心的高效配置,推動智慧城市、精準醫療等場景的大規模落地。從算力到存力,從數據資源到數據資產,一場深刻的產業變革正在上演。



Scroll to Top