騰訊云向量數(shù)據(jù)庫正式上線公測(cè)！提供10億級(jí)向量檢索能力

來源：騰訊云數(shù)據(jù)庫

作者：騰訊云數(shù)據(jù)庫

時(shí)間：2023-08-02

8月1日，騰訊云向量數(shù)據(jù)庫（Tencent Cloud Vector DB）正式上線公測(cè)。

騰訊云向量數(shù)據(jù)庫不僅能為大模型提供外部知識(shí)庫，提高大模型回答的準(zhǔn)確性，還可廣泛應(yīng)用于推薦系統(tǒng)、文本圖像檢索、自然語言處理等AI領(lǐng)域。騰訊云向量數(shù)據(jù)庫是國內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫。

作為一款全托管的自研企業(yè)級(jí)分布式數(shù)據(jù)庫服務(wù)，騰訊云向量數(shù)據(jù)庫專用于存儲(chǔ)、檢索、分析多維向量數(shù)據(jù)。該數(shù)據(jù)庫支持多種索引類型和相似度計(jì)算方法，單索引支持10億級(jí)向量規(guī)模，可支持百萬級(jí)QPS及毫秒級(jí)查詢延遲。

640 （2）.png

向量數(shù)據(jù)庫通過把數(shù)據(jù)向量化然后進(jìn)行存儲(chǔ)和查詢，可以極大地提升效率和降低成本。它能解決大模型預(yù)訓(xùn)練成本高、沒有“長(zhǎng)期記憶”、知識(shí)更新不足、提示詞工程復(fù)雜等問題，突破大模型在時(shí)間和空間上的限制，加速大模型落地行業(yè)場(chǎng)景。

統(tǒng)計(jì)顯示，將騰訊云向量數(shù)據(jù)庫用于大模型預(yù)訓(xùn)練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實(shí)現(xiàn)10倍效率的提升，如果將向量數(shù)據(jù)庫作為外部知識(shí)庫用于模型推理，則可以將成本降低2-4個(gè)數(shù)量級(jí)。

企業(yè)原先接入一個(gè)大模型需要花1個(gè)月左右時(shí)間，使用騰訊云向量數(shù)據(jù)庫后，3天時(shí)間即可完成，極大降低了企業(yè)的接入成本。

此前，騰訊云向量數(shù)據(jù)庫的向量化能力（embedding）曾多次獲得權(quán)威機(jī)構(gòu)認(rèn)可，2021年曾登頂MS MARCO榜單第一、相關(guān)成果已發(fā)表于NLP頂會(huì)EMNLP。

騰訊云云計(jì)算

上一篇：疫情影響對(duì)韓國品牌的品牌價(jià)值的損失多達(dá)11%

原文鏈接：點(diǎn)擊前往 >

文章來源：騰訊云數(shù)據(jù)庫

版權(quán)說明：本文內(nèi)容來自于騰訊云數(shù)據(jù)庫，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán)，請(qǐng)聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章