【環球網科技綜合報道】5月19日-23日,國際頂級數據庫學術會議ICDE 2025(第41屆IEEE國際數據工程大會)於中國香港舉辦。本屆會議中國高校和企業表現亮眼,其中數據庫廠商OceanBase共有6篇論文入選,有1篇獲“最佳工業和應用論文亞軍”,研究方向包括分佈式數據庫、聯邦學習、隱私保護等,展現了其在數據庫與AI融合上的突破進展。
ICDE與SIGMOD、VLDB並稱爲數據庫領域三大頂級會議,是中國計算機學會CCF推薦的A類國際學術會議,在全球學術圈中擁有極高的權威性和影響力。本屆會議吸引近千名全球頂尖學者及行業專家參與,聚焦數據工程領域的前沿技術突破與行業應用實踐。
伴隨AI技術的爆發式發展,數據庫作爲數據存儲和管理的核心繫統,面臨海量數據存儲、複雜計算需求、隱私保護等多重挑戰。以OceanBase爲代表的數據庫廠商正在創新探索數據庫與AI的融合,建造AI時代數據底座。
被評定爲“最佳工業和應用論文亞軍”的《OceanBase單元化:構建下一代在線地圖應用》,介紹了OceanBase的單元化架構設計。該架構將系統服務拆分爲多個獨立“單元”,每個單元可在單臺服務器獨立部署並支持跨區域多機協同,結合讀寫分離和混合架構,系統自動平衡事務型(OLTP)和分析型(OLAP)負載,實現高可用、彈性擴展、資源隔離和高性能,高效處理大規模數據和高併發訪問。該架構已在高德地圖落地實踐,展現增強的容災能力,並在寫密集型和讀密集型基準測試中均實現性能提升。
在AI重塑數據處理需求的背景下,OceanBase多項研究聚焦數據庫與AI融合,探索智能化數據處理路徑。
例如,針對縱向聯邦學習中參與方選擇效率低、數據多樣性不足的痛點,《追蹤數據多樣性:縱向聯邦學習中的參與者選擇》一文提出VFPS-SM優化框架。該框架將參與方選擇轉化爲“子模函數最大化”數學問題,結合KNN算法、top-k查詢與加密技術,在保護數據隱私的前提下,使參與方選擇效率最高提升365倍、模型訓練效率提升35倍。這一技術可應用於醫療、物流、交通等領域,助力跨機構數據協作建模,例如加速多醫院聯合疾病預測模型的開發。
另一篇論文《如何響應安全且私密的SQL查詢》聚焦數據安全與訪問效率、查詢精度的平衡。文章綜述現有安全隱私SQL查詢的算法,總結了一套通過模塊化拆解複雜SQL查詢的方法,結合安全計算與差分隱私技術,在保證數據安全、用戶隱私的情況下,提高SQL查詢的效率和精度。
在ICDE 2025上,OceanBase還受邀舉辦一場題爲“AI時代的數據庫”的研討會,多位數據庫與AI領域的資深學者和研究員參會發言,分享Data x AI領域最前沿的學術進展與創新實踐。
AI技術的引入,正逐步將數據庫推向全新時代。作爲根自研的原生分佈式數據庫,OceanBase自2010年創立以來,始終堅持技術創新,多次在SIGMOD、VLDB、ICDE、AAAI等國際學術舞臺展示硬實力,並與華東師範大學、中國人民大學、武漢大學、新加坡南洋理工大學等機構合作,共同探索數據庫前沿技術。2025年4月,OceanBase CEO楊冰宣佈公司全面進入AI時代,提出“Data x AI”戰略,啓動人才和組織體系升級,建設AI時代的數據底座。(勃潺)