AWS更新其ETL(Extract、Transform、Load)服務發(fā)布AWS Glue 2.0,能夠執(zhí)行Spark ETL作業(yè),啟動時間較前一代還要快10倍,最小計耗時間更短,可被靈活地用來處理交互性高的工作負載。目前AWS Glue 2.0已經在美東、歐洲、亞太、中東和南美各區(qū)上線。
AWS Glue是一項無服務器ETL服務,用戶無需配置或是管理主機,能夠簡單地準備和加載需要分析的資料。最新的Glue服務,主打能快速啟動的Spark ETL作業(yè),啟動速度是前一代的10倍,官方提到,啟動等待時間減少,可以降低整體作業(yè)時間,而且通過腳本開發(fā)和資料探索,能良好地支持微批次、高交互性的工作負載,并提升生產力。
除此之外,AWS Glue 2.0的Spark作業(yè)能以每秒計費,而且還降低了最小計耗時間,從原本最少計耗時間10分鐘降到了1分鐘,如此用戶能夠以更劃算的價格,將AWS Glue靈活地用來處理較小且交互性高的工作負載。
AWS提到,因為AWS Glue 2.0的啟動作業(yè)速度更快,用戶能夠更可靠地執(zhí)行SLA資料工作管線,并且使資料探索和實驗更具交互性。另外,AWS Glue 2.0還有一項新功能,能讓用戶從Wheel文件或是存儲庫中,安裝Python模塊。