Azure SQL 數(shù)據(jù)庫(kù)倉(cāng)庫(kù)Data Warehouse入門

來源: 博客園
作者:Lei Zhang
時(shí)間:2020-09-08
17415
SQL DW是云端的企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù),用來處理TB,甚至PB級(jí)別的關(guān)系型數(shù)據(jù)庫(kù)的OLAP(聯(lián)機(jī)分析處理)場(chǎng)景,主要用來做數(shù)據(jù)分析和查詢。

pexels-polina-zimmerman-3746958.jpg

1.什么是SQL數(shù)據(jù)庫(kù)倉(cāng)庫(kù)(SQL DW)

SQL DW是云端的企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù),用來處理TB,甚至PB級(jí)別的關(guān)系型數(shù)據(jù)庫(kù)的OLAP(聯(lián)機(jī)分析處理)場(chǎng)景,主要用來做數(shù)據(jù)分析和查詢。

2.什么是OLAP

OLAP(Online Analysis Processing)聯(lián)機(jī)分析處理。表示從多維數(shù)據(jù)集的多維結(jié)構(gòu)來對(duì)數(shù)據(jù)進(jìn)行聚合處理

3.OLAP和OLTP的區(qū)別

OLTP(Online Transaction Processing),聯(lián)機(jī)事務(wù)處理。表示事務(wù)性非常高的系統(tǒng),高頻度的插入、讀取、刪除操作

OLAP和OLTP的使用場(chǎng)景不一樣

4.SQL Data Warehouse不適合的場(chǎng)景

SQL DW不適合OLTP的場(chǎng)景,不適合數(shù)據(jù)庫(kù)的高頻Insert/update/delete

(1)OLTP工作負(fù)載

(2)大量的小讀寫

(3)多租戶數(shù)據(jù)庫(kù)

(4)經(jīng)常更改架構(gòu)

(5)逐行處理

(6)JSON,XML數(shù)據(jù)和Spatial,Struct,Array和Map數(shù)據(jù)類型

(7)Power BI直接查詢需要儀表板性能

(8)查詢的高并發(fā)性(例如,數(shù)十萬個(gè)并發(fā)查詢)

(9)小數(shù)據(jù)集(小于250GB)

(10)通過嚴(yán)格的RPO和RTO進(jìn)行災(zāi)難恢復(fù)

5.SQL DW適合的場(chǎng)景

SQL適合OLAP(聯(lián)機(jī)分析處理)的場(chǎng)景,比如報(bào)告,統(tǒng)計(jì),分析等場(chǎng)景

6.SQL DW的設(shè)計(jì)模式

(1)批量導(dǎo)入數(shù)據(jù)

(2)將Table數(shù)據(jù)拆分為事實(shí)表和維度表

(3)涉及多張表鏈接的復(fù)雜查詢

(4)針對(duì)某些維度的聚合查詢

7.什么叫做事實(shí)表和維度表

(1)事實(shí)表,就是用來存儲(chǔ)真實(shí)數(shù)據(jù)的表,包含數(shù)字信息。比如訂單數(shù)據(jù)表,銷售數(shù)據(jù)表等。事實(shí)表中的數(shù)據(jù)量一般很大

(2)維度表,就是用來描述用戶分析數(shù)據(jù)的角度。一般是事實(shí)表的外鍵表,比如年-月-日,大洲-國(guó)家-省份。

一般來說,事實(shí)表就是要關(guān)注的內(nèi)容,維度表就是進(jìn)行統(tǒng)計(jì)的角度。

8.SQL DW的使用場(chǎng)景

(1)在過去1個(gè)月內(nèi),有多少客戶訂購(gòu)了該產(chǎn)品,統(tǒng)計(jì)庫(kù)存水平是否足夠

(2)一周內(nèi),哪一天客戶從ATM取款最多

(3)統(tǒng)計(jì)過去30天內(nèi),每天的銷售額有多少

9.Azure SQL DW采用了大規(guī)模并行處理(MPP)架構(gòu)。

作為微軟云Azure的一種服務(wù),Azure SQL DW由微軟維護(hù)底層的硬件和軟件,以保證SQL DW始終運(yùn)行在Azure最新的硬件和軟件上

客戶可以輕松的把數(shù)據(jù)加載到SQL DW并進(jìn)行查詢,在業(yè)務(wù)高峰時(shí),可以橫向擴(kuò)展計(jì)算節(jié)點(diǎn)

10.什么是大規(guī)模并行處理MPP架構(gòu)

MPP架構(gòu)的角色分為頭節(jié)點(diǎn)(Head Node)和工作節(jié)點(diǎn)(Work Node)。

Head Node保存了數(shù)據(jù)表的源數(shù)據(jù)(Meta data),也就是說Head Node知道數(shù)據(jù)庫(kù)的哪些數(shù)據(jù),保存在哪些Work Node里

用戶的數(shù)據(jù)表分布在不同的Work Node里。

當(dāng)用戶對(duì)SQL DW進(jìn)行查詢的時(shí)候,Head Node會(huì)把查詢語(yǔ)句分解為很多子查詢,根據(jù)需要進(jìn)行數(shù)據(jù)移動(dòng),并且把這些子查詢發(fā)送給Work Node以進(jìn)行并行執(zhí)行

舉個(gè)例子,假設(shè)1個(gè)班級(jí)有60個(gè)學(xué)生,當(dāng)老師需要批改作業(yè)的時(shí)候,有兩種方法:

(1)老師一個(gè)人批改所有60個(gè)學(xué)生的試卷,速度會(huì)很慢

(2)老師把學(xué)生分為6組,每組10個(gè)人。然后把全班的試卷平均的分配給這6組。由每個(gè)組各自批改試卷。這樣批改作業(yè)就平行了

顯而易見,第二種方法的效率最高

MPP架構(gòu),除了微軟的SQL DW以外,還有Hadoop(Hive和Spark),Teradata,Amazon Redshift,Vertica等產(chǎn)品

11.SMP架構(gòu)

與MPP相反架構(gòu),是SMP(Symmetric Multiprocessing),這就類似于傳統(tǒng)的單一數(shù)據(jù)庫(kù)。所有的業(yè)務(wù)邏輯都有1臺(tái)服務(wù)器在處理

比如傳統(tǒng)的SQL Server,MySQL等,都屬于SMP架構(gòu)

12.MPP架構(gòu)和SMP架構(gòu),如何支撐更多的業(yè)務(wù)需求

(1)在MPP架構(gòu)里,計(jì)算節(jié)點(diǎn)是橫向擴(kuò)展的。比如從6個(gè)節(jié)點(diǎn)并行處理,橫向擴(kuò)展為20個(gè)節(jié)點(diǎn)并行處理。這種方式又被稱為Scale-Out

(2)在SMP架構(gòu)里,計(jì)算節(jié)點(diǎn)和向上向下擴(kuò)展的。比如從1臺(tái)8Core/16GB的服務(wù)器,向上擴(kuò)展為1臺(tái)32Core/512GB的服務(wù)器。這種方式又被稱為Scale-Up

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于博客園,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
隨著人工智能技術(shù)持續(xù)重塑企業(yè)運(yùn)營(yíng)方式,企業(yè)需要能夠處理海量數(shù)據(jù)的系統(tǒng),以支持實(shí)時(shí)洞察,同時(shí)幫助他們應(yīng)對(duì)跨IT和OT環(huán)境(包括云端、邊緣和本地)中運(yùn)營(yíng)、應(yīng)用、數(shù)據(jù)和基礎(chǔ)設(shè)施的協(xié)作難題。
Azure
微軟云
云服務(wù)
2024-12-172024-12-17
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來
.NET 9現(xiàn)已正式發(fā)布,它為.NET平臺(tái)的發(fā)展掀開了嶄新的一頁(yè),突破了性能、云原生開發(fā)和AI技術(shù)集成的邊界。
Azure
微軟云
云服務(wù)
2024-12-162024-12-16
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
智能Microsoft Copilot副駕駛for Azure網(wǎng)絡(luò)服務(wù)現(xiàn)已推出公共預(yù)覽版。
Azure
微軟云
云服務(wù)
2024-12-102024-12-10
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
一年前,我們正式推出了一款端到端數(shù)據(jù)平臺(tái),旨在幫助組織推動(dòng)人工智能轉(zhuǎn)型,并重新定義數(shù)據(jù)的連接、管理和分析方式。
Azure
微軟云
云服務(wù)
2024-12-092024-12-09
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家