11月15日,中國信通院聯合騰訊云計算(北京)有限責任公司、中移(蘇州)軟件技術有限公司等多家企業共同編制的、國內首個向量數據庫標準正式發布,將為我國向量數據庫研發、測試及選型提供重要參考,推動我國人工智能產業高質量發展。
向量數據能夠從多個維度記錄事物特征,是人工智能時代的基礎數據形式。人工智能系統正是通過海量向量數據所標記的事物特征,準確理解、認識事物。向量數據庫則能夠對海量向量數據進行有效儲存、檢索、管理。
傳統關系型數據庫主要基于表格形式,按照行和列來組織、儲存數據,在進行檢索時需要逐行、逐列進行搜索,不利于對向量數據進行快速檢索和高效管理。而向量數據庫借助向量索引等技術,在進行數據檢索時,可以通過模糊匹配來進行近似查找,能夠以最快速度找出符合需求的數據,顯著提升人工智能系統的數據檢索、處理效率。
中國信通院云計算與大數據研究所大數據與區塊鏈部主任姜春宇在當日舉行的“AG時代的‘數據樞紐’騰訊云向量數據庫技術及產業峰會”上表示,今年以來,人工智能大模型的爆發式發展,進一步催生了行業對向量數據庫的需求,向量數據庫關注度持續上升。但長期以來,在向量數據庫技術架構、查詢語言、使用成本等方面,行業共識不足,有較多亟待解決的關鍵問題。
為進一步推動行業形成對向量數據庫基礎能力的基本共識,推動向量數據庫技術產業發展和規模化應用,中國信通院云計算與大數據研究所依托中國通信標準化協會大數據技術標準推進委員會,推動向量數據庫領域標準化相關工作。此次發布的向量數據庫標準聚焦七大能力域,包含47個能力測試項,其中有27個必選項和20個可選項。目前,騰訊云向量數據庫是首個完成標準評價的向量數據庫,通過全部必選測試項。
來源 | 科技日報