云計算數(shù)據(jù)倉庫BigQuery現(xiàn)可生成文本嵌入強化自然語言應(yīng)用

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2023-08-30
2965
Google云計算數(shù)據(jù)倉庫服務(wù)BigQuery加入文本嵌入(Text Embedding)生成功能,開發(fā)者將可以通過熟悉的SQL指令截取文本嵌入,并將其應(yīng)用到下游應(yīng)用程序中。目前BigQuery所支持的文本嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

introducing_bigquery_text_embeddings.jpg

Google云計算數(shù)據(jù)倉庫服務(wù)BigQuery加入文本嵌入(Text Embedding)生成功能,開發(fā)者將可以通過熟悉的SQL指令截取文本嵌入,并將其應(yīng)用到下游應(yīng)用程序中。目前BigQuery所支持的文本嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

這項新功能的使用流程,由注冊需要的模型成為遠程模型開始,接著用戶就可以使用生成文本嵌入函數(shù)來生成嵌入,而這些操作都僅使用BigQuery SQL就可以完成。文本嵌入是一個由文本轉(zhuǎn)化而來的矢量,可用來尋找相似的項目,像是語義搜索、分類、分群、異常偵測和或是對話式接口等應(yīng)用。

BigQuery新支持的4種模型嵌入,其中textembedding-gecko是運用Google語言模型PaLM生成嵌入,其他三個模型BERT、NNLM以及SWIVEL,則都可以從TensorFlow Hub選用。BERT是Transformer架構(gòu)的深度預訓練網(wǎng)絡(luò),可針對自然語言生成密集的矢量表示,NNLM與SWIVEL則是以英文Google新聞?wù)Z料庫訓練而成。

同時,官方也宣布開始支持array。

立即登錄,閱讀全文
原文鏈接:點擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家