AWS更新Redshift簡化資料截取并提升可靠性

來源：十輪網(wǎng)

作者：十輪網(wǎng)

時間：2022-12-07

AWS針對其云計算數(shù)據(jù)倉庫服務Redshift進行一系列更新，目標是要讓用戶能夠更簡單地截取資料，并且在安全可靠的環(huán)境，快速分析資料。

pexels-photo-7647937.webp.jpg

AWS針對其云計算數(shù)據(jù)倉庫服務Redshift進行一系列更新，目標是要讓用戶能夠更簡單地截取資料，并且在安全可靠的環(huán)境，快速分析資料。

Redshift現(xiàn)在支持從S3自動復制資料，也就是說，Redshift能夠自動將進到S3存儲桶中的文件加載到數(shù)據(jù)倉庫中，這包括CSV、JSON、Parquet和Avro格式，如此用戶便不需要手動，或是重復執(zhí)行復制程序這些繁瑣的工作。另外，Redshift也開始支持流媒體截取，可以從MSK和Kinesis服務，每秒截取數(shù)百MB的資料。

AWS關聯(lián)數(shù)據(jù)庫服務Aurora的零ETL功能也已經(jīng)與Redshift集成，如此用戶便可以利用Redshift，以接近即時的速度，對存儲在Aurora MySQL數(shù)據(jù)庫的資料，進行分析和執(zhí)行機器學習工作負載。AWS解釋了服務集成背后的機制，當交易資料寫入到Aurora后，資料便會在數(shù)秒鐘內(nèi)復制到Redshift中。復制過程不需要用戶手動構建和維護復雜的資料工作管線，還可以選擇從多個Aurora數(shù)據(jù)庫，復制資料到同一個Redshift執(zhí)行實例，以跨多個應用程序進行分析。

Redshift執(zhí)行實例現(xiàn)在能夠被部署于多個可用區(qū)域，以增加數(shù)據(jù)倉庫的可用性，并利用自動恢復將恢復時間降至數(shù)秒鐘，另外，Redshift提供動態(tài)資料遮罩功能，可以保護存儲在數(shù)據(jù)倉庫中的敏感資料，限制不同權限的用戶能夠查看到的資料。這使得管理者不需要創(chuàng)建多個人信息料副本，就能方便不同層級的用戶和群組，訪問不同層級的資料。

除此之外，Redshift現(xiàn)在也與Apache Spark集成，使得用戶更容易在Redshift和無服務器Redshift服務上，構建和執(zhí)行Spark應用程序。AWS Backup也添加了Redshift的支持，AWS Backup使用戶可以定義備份策略來管理應用程序的資料保護，而現(xiàn)在Redshift也受AWS Backup保護，讓用戶在資料服務獲得更一致的保護功能。

AWS 亞馬遜云科技

上一篇：歐盟監(jiān)管機構裁定：Meta將只能在用戶同意的情況下根據(jù)個人數(shù)據(jù)投放廣告

原文鏈接：點擊前往 >

版權說明：本文內(nèi)容來自于十輪網(wǎng)，本站不擁有所有權，不承擔相關法律責任。文章內(nèi)容系作者個人觀點，不代表快出海對觀點贊同或支持。如有侵權，請聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關文章