GCP集成Tecton平臺(tái)強(qiáng)化機(jī)器學(xué)習(xí)特征管理

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-08-01
2753
Google云計(jì)算加入一個(gè)稱為Tecton的功能平臺(tái),可自動(dòng)執(zhí)行生產(chǎn)環(huán)境中,構(gòu)建和管理機(jī)器學(xué)習(xí)特征的步驟。

integrating_tecton_with_google_cloud_platform.jpg

Google云計(jì)算加入一個(gè)稱為Tecton的功能平臺(tái),可自動(dòng)執(zhí)行生產(chǎn)環(huán)境中,構(gòu)建和管理機(jī)器學(xué)習(xí)特征的步驟,Tecton是一個(gè)全托管特征構(gòu)建和調(diào)度服務(wù),可完整管理機(jī)器學(xué)習(xí)特征生命周期,降低組織構(gòu)建、管理和共享機(jī)器學(xué)習(xí)特征的障礙,并提高模型性能和可靠性,控制機(jī)器學(xué)習(xí)應(yīng)用程序的開發(fā)和維護(hù)成本。

目前不少企業(yè)開始將機(jī)器學(xué)習(xí)功能集成進(jìn)應(yīng)用程序中,但是機(jī)器學(xué)習(xí)模型需要高品質(zhì)的數(shù)據(jù),經(jīng)過轉(zhuǎn)換創(chuàng)建機(jī)器學(xué)習(xí)特征,才能做出精準(zhǔn)預(yù)測(cè),而Google提到,構(gòu)建和管理生產(chǎn)環(huán)境機(jī)器學(xué)習(xí)特征數(shù)據(jù)工作管線并不容易,這些工作管線的數(shù)據(jù)來自批處理或是流媒體傳輸?shù)炔煌瑏碓?,在將這些數(shù)據(jù)轉(zhuǎn)換成為機(jī)器學(xué)習(xí)特征之后,才能用于訓(xùn)練和服務(wù)上。

而Tecton的目標(biāo)是要能自動(dòng)處理機(jī)器學(xué)習(xí)特征的構(gòu)建、處理、共享和供給工作,數(shù)據(jù)團(tuán)隊(duì)可以使用Tecton的聲明式框架,將特征定義為程序代碼,在底層會(huì)由Tecton調(diào)度轉(zhuǎn)換與實(shí)現(xiàn)機(jī)器學(xué)習(xí)特征所需要的實(shí)際工作管線。通過Google Cloud Build這類CI/CD工具,開發(fā)者可以將Tecton特征當(dāng)作程序代碼進(jìn)行管理,集中管理程序代碼方便共享和協(xié)作,就像是管理基礎(chǔ)設(shè)施即程序代碼,或是模型即程序代碼一樣。

Tecton可自動(dòng)連接和維護(hù)Google云計(jì)算批處理和流媒體服務(wù)的新數(shù)據(jù),同時(shí)Tecton也支持來自包括Redshift、Snowflake和Apache Kafka等非GCP的數(shù)據(jù)。Tecton在Google云計(jì)算上,會(huì)使用Databricks或Dataproc分布式運(yùn)算平臺(tái)聚合和轉(zhuǎn)換數(shù)據(jù),將傳入的數(shù)據(jù)轉(zhuǎn)換成為特征,放到線上與脫機(jī)特征商店中。數(shù)據(jù)特征存放在Tecton低延遲線上存儲(chǔ),服務(wù)即時(shí)供給需求,同時(shí)也會(huì)存放在脫機(jī)存儲(chǔ),以用于產(chǎn)生訓(xùn)練數(shù)據(jù)集和脫機(jī)推理用途。

原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家