8月1日,騰訊云向量數據庫(Tencent Cloud Vector DB)正式上線公測。
騰訊云向量數據庫不僅能為大模型提供外部知識庫,提高大模型回答的準確性,還可廣泛應用于推薦系統(tǒng)、文本圖像檢索、自然語言處理等AI領域。騰訊云向量數據庫是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫。
作為一款全托管的自研企業(yè)級分布式數據庫服務,騰訊云向量數據庫專用于存儲、檢索、分析多維向量數據。該數據庫支持多種索引類型和相似度計算方法,單索引支持10億級向量規(guī)模,可支持百萬級QPS及毫秒級查詢延遲。
向量數據庫通過把數據向量化然后進行存儲和查詢,可以極大地提升效率和降低成本。它能解決大模型預訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,突破大模型在時間和空間上的限制,加速大模型落地行業(yè)場景。
統(tǒng)計顯示,將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統(tǒng)方式可以實現10倍效率的提升,如果將向量數據庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數量級。
企業(yè)原先接入一個大模型需要花1個月左右時間,使用騰訊云向量數據庫后,3天時間即可完成,極大降低了企業(yè)的接入成本。
此前,騰訊云向量數據庫的向量化能力(embedding)曾多次獲得權威機構認可,2021年曾登頂MS MARCO榜單第一、相關成果已發(fā)表于NLP頂會EMNLP。