AWS針對其云計算數(shù)據(jù)倉庫服務Redshift進行一系列更新,目標是要讓用戶能夠更簡單地截取資料,并且在安全可靠的環(huán)境,快速分析資料。
Redshift現(xiàn)在支持從S3自動復制資料,也就是說,Redshift能夠自動將進到S3存儲桶中的文件加載到數(shù)據(jù)倉庫中,這包括CSV、JSON、Parquet和Avro格式,如此用戶便不需要手動,或是重復執(zhí)行復制程序這些繁瑣的工作。另外,Redshift也開始支持流媒體截取,可以從MSK和Kinesis服務,每秒截取數(shù)百MB的資料。
AWS關聯(lián)數(shù)據(jù)庫服務Aurora的零ETL功能也已經(jīng)與Redshift集成,如此用戶便可以利用Redshift,以接近即時的速度,對存儲在Aurora MySQL數(shù)據(jù)庫的資料,進行分析和執(zhí)行機器學習工作負載。AWS解釋了服務集成背后的機制,當交易資料寫入到Aurora后,資料便會在數(shù)秒鐘內(nèi)復制到Redshift中。復制過程不需要用戶手動構建和維護復雜的資料工作管線,還可以選擇從多個Aurora數(shù)據(jù)庫,復制資料到同一個Redshift執(zhí)行實例,以跨多個應用程序進行分析。
Redshift執(zhí)行實例現(xiàn)在能夠被部署于多個可用區(qū)域,以增加數(shù)據(jù)倉庫的可用性,并利用自動恢復將恢復時間降至數(shù)秒鐘,另外,Redshift提供動態(tài)資料遮罩功能,可以保護存儲在數(shù)據(jù)倉庫中的敏感資料,限制不同權限的用戶能夠查看到的資料。這使得管理者不需要創(chuàng)建多個人信息料副本,就能方便不同層級的用戶和群組,訪問不同層級的資料。
除此之外,Redshift現(xiàn)在也與Apache Spark集成,使得用戶更容易在Redshift和無服務器Redshift服務上,構建和執(zhí)行Spark應用程序。AWS Backup也添加了Redshift的支持,AWS Backup使用戶可以定義備份策略來管理應用程序的資料保護,而現(xiàn)在Redshift也受AWS Backup保護,讓用戶在資料服務獲得更一致的保護功能。