01
伴隨信息技術(shù)的全球化發(fā)展及應(yīng)用,SAP系統(tǒng)作為全世界排名第一位的ERP企業(yè)資源計(jì)劃系統(tǒng)軟件(Enterprise Resource Planning),企業(yè)依托其系統(tǒng)化管理的理論與信息技術(shù),創(chuàng)建信息化管理系統(tǒng)平臺(tái),輔助公司制定決策與經(jīng)營管理。SAP系統(tǒng)的可用性以及穩(wěn)定性是企業(yè)核心業(yè)務(wù)得以保障的前提,所以企業(yè)往往投資比較大的成本在設(shè)計(jì)搭建SAP系統(tǒng)構(gòu)架。生產(chǎn)機(jī)的高可用都是基本配置要求,異地容災(zāi)也是經(jīng)常被一些高要求的客戶所使用。
拿一套S/4生產(chǎn)系統(tǒng)構(gòu)架來舉例,最佳實(shí)踐建議采用HA/DR的部署方式來提供比較高的系統(tǒng)可用性。
1. 高可用(HA - High Availability)
2. 容災(zāi)(DR – Disaster Recovery)
國內(nèi)現(xiàn)實(shí)中還是有很多企業(yè),他們的SAP ERP/ S/4等生產(chǎn)機(jī)還沒有部署容災(zāi)系統(tǒng),這并不意味著他們不需要容災(zāi)來提供生產(chǎn)業(yè)務(wù)的保障,而是SAP系統(tǒng)搭建異地容災(zāi)系統(tǒng)的成本往往是也需要投入比較大的成本,傳統(tǒng)的部署方式要考慮1 是否異地部署以及數(shù)據(jù)中心搭建 2 采購滿配的生產(chǎn)硬件 3 獨(dú)立的線路連通 這些都是傳統(tǒng)企業(yè)擺在IT巨大成本投入以及業(yè)務(wù)間需求難以平衡的問題。
隨著云技術(shù)的發(fā)展,如今SAP容災(zāi)上云已經(jīng)很好的解決了這三個(gè)難題:
Azure云為國內(nèi)客戶提供了北京,上海兩地選擇,輕松滿足SAP異地容災(zāi)需求。
Azure客戶即可復(fù)用已有ER專線進(jìn)行數(shù)據(jù)同步,也可以利用internet S2S VPN方式連接到云端服務(wù)器進(jìn)行數(shù)據(jù)同步。
利用云上彈性靈活配置功能,日常容災(zāi)系統(tǒng)只需要開啟數(shù)據(jù)庫最低配置來滿足數(shù)據(jù)同步需求,發(fā)生切換容災(zāi)系統(tǒng)需求時(shí)刻,按需拉起應(yīng)用服務(wù)器系統(tǒng),擴(kuò)容數(shù)據(jù)庫機(jī)器配置。
02
在了解SAP容災(zāi)之前,讓我們先聊聊兩個(gè)指標(biāo)RTO和RPO,容災(zāi)構(gòu)架中設(shè)計(jì)的關(guān)鍵要求:
RPO(Recovery Point Objective):即數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo),主要指的是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量,指災(zāi)難發(fā)生后,從IT系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓之時(shí)開始,到IT系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作、恢復(fù)運(yùn)營之時(shí),此兩點(diǎn)之間的時(shí)間段稱為RTO。
RTO(Recovery Time Objective):即恢復(fù)時(shí)間目標(biāo),主要指的是所能容忍的業(yè)務(wù)停止服務(wù)的最長時(shí)間,也就是從災(zāi)難發(fā)生到業(yè)務(wù)系統(tǒng)恢復(fù)服務(wù)功能所需要的最短時(shí)間周期。
具體樣例參考下面式樣:
技術(shù)上我們是如何實(shí)現(xiàn)SAP系統(tǒng)本地與云上容災(zāi)部署呢?
首先我們先來了解一下本地?cái)?shù)據(jù)中心與Azure網(wǎng)絡(luò)連接問題,SAP上云場景一般會(huì)采用兩種連接方式:
1. ER專線連接 --- 安全,穩(wěn)定,獨(dú)享
推薦獨(dú)立專線給SAP系統(tǒng)使用 例如客戶總部或則核心工廠使用,或則客戶有非sap解決方案在以及SAP系統(tǒng)在azure云混用場景,單獨(dú)使用一條專線給SAP核心系統(tǒng)使用。
2. VPN互聯(lián)網(wǎng)連接 --- 快捷靈活,成本低
有網(wǎng)絡(luò)抖動(dòng),推薦作為專線補(bǔ)充,例如客戶只有容災(zāi)系統(tǒng)部署,一些分公司辦公室工廠等連接。
然后我們再來看下系統(tǒng)構(gòu)架,一套SAP系統(tǒng)本身是有應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器構(gòu)成,所以我們無論在云端還是本地端,都要考慮兩層的數(shù)據(jù)如何部署同步。表單組件只有開啟編輯區(qū)域的增強(qiáng)特性后才能看到,目前支持單行文字、單選和多選組件,在圖文的狀態(tài)頁面可以查看提交的表單數(shù)據(jù)。
--- 數(shù)據(jù)庫層面同步機(jī)制一般采用數(shù)據(jù)庫本身同步方式,例如HANA數(shù)據(jù)庫可以利用HSR(hana system replication)異步方式進(jìn)行同步,由于HANA是內(nèi)存式數(shù)據(jù)庫,容災(zāi)節(jié)點(diǎn)只做數(shù)據(jù)同步不做數(shù)據(jù)處理,所以硬件資源配置一般可以采用相對主節(jié)點(diǎn)半配的大小,舉例主節(jié)點(diǎn)采用了1TB的HANA節(jié)點(diǎn),次節(jié)點(diǎn)可以采用HANA數(shù)據(jù)庫表unload模式從而使用512GB或指更小的節(jié)點(diǎn),當(dāng)然也可以利用數(shù)據(jù)庫pre-load功能來減少RTO時(shí)間到分鐘級別,就看業(yè)務(wù)的需求來靈活配置。發(fā)生業(yè)務(wù)切換時(shí),再按照主節(jié)點(diǎn)大小,動(dòng)態(tài)調(diào)整HANA虛機(jī)服務(wù)器到1TB節(jié)點(diǎn),充分利用云上彈性能力來解決SAP容災(zāi)成本高的問題。
--- 應(yīng)用服務(wù)器可以采用腳本方式或ASR(Azure Site Recovery)鏡像同步方式來進(jìn)行同步。
由于應(yīng)用服務(wù)器存儲(chǔ)的數(shù)據(jù)以配置文件和執(zhí)行文件為主,采用OS腳本定期同步SAP trans sapmnt kernel等文件目錄數(shù)據(jù), 例如每年容災(zāi)演練時(shí)候,或則Kernel定期升級時(shí)候。或者采用Azure Site Recovery來進(jìn)行虛機(jī)級別同步,特別適用于SAP容災(zāi)系統(tǒng)比較多,運(yùn)維復(fù)雜的場景,可以簡化客戶運(yùn)維工作量。容災(zāi)應(yīng)用服務(wù)器平時(shí)建議采用關(guān)閉模式來降低成本。
03
SAP容災(zāi)設(shè)計(jì)過程中,客戶一般最關(guān)心的還是RPO以及RTO的指標(biāo)是如何定義和實(shí)現(xiàn)的。
簡單來說RTO分兩部分內(nèi)容:1.技術(shù)切換時(shí)間, 一般30-60分鐘內(nèi)可以完成核心系統(tǒng)切換及拉起的操作 2.業(yè)務(wù)驗(yàn)證時(shí)間,需要客戶調(diào)整DNS指向,切換三方接口連接,業(yè)務(wù)顧問驗(yàn)證系統(tǒng)數(shù)據(jù),開放用戶使用,一般時(shí)間2-4小時(shí)或則更久,取決于流程要求以及熟練程度。所以RTO時(shí)間越短,需要IT運(yùn)維團(tuán)隊(duì)越熟練容災(zāi)切換的流程,需要每年的演練測試來保證容災(zāi)系統(tǒng)的RTO要求可以被滿足。
關(guān)于RPO時(shí)間,我們要估計(jì)HANA所需的吞吐量,需要知道在日常工作負(fù)載期間生成的數(shù)據(jù)和日志的大小。要獲取此信息,您可以使用zip文件中包含的SQL語句之一,該文件附在此SAP Note 1969700中。它提供了一組復(fù)雜的SQL語句,包括一些與SAP HANA系統(tǒng)復(fù)制相關(guān)的語句,可以導(dǎo)入到SAP HANA studio并在其中執(zhí)行,如下所示:
1.選擇從SAP note中下載的“SQL Statements.zip”文件
2. 右鍵單擊Bandwidths,然后在SQL控制臺(tái)中選擇Open
3. 在這個(gè)SQL語句中,您可以更改/*修改部分*/以便結(jié)果按“天”顯示;例如:
有關(guān)網(wǎng)絡(luò)吞吐量的要求取決于所選的操作模式,因?yàn)椋ㄈ缟纤觯┩ㄟ^網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)量不同。特別相關(guān)的是上面標(biāo)記的PERSISTENCE_GB和LOG_SIZE_GB值. 利用這兩個(gè)值來計(jì)算相應(yīng)的帶寬來滿足業(yè)務(wù)RPO的要求。舉例來說,一天log數(shù)據(jù)同步量為100GB,RPO要求30分鐘,需要的最低帶寬是多少呢?我們來算下:
100GB*1024/24h/2 約等于產(chǎn)生2133M半小時(shí)數(shù)據(jù)量,假設(shè)2133M數(shù)據(jù)量在需要1800秒(30分鐘) 內(nèi)傳輸?shù)絘zure云,所需帶寬為
2133M/30m/60s*8=9.5Mbs/s
即需要10M左右?guī)挶U蟁PO為30分鐘,所以RPO15分鐘為20M帶寬,RPO 1分鐘為300M帶寬,以此類推。
04
最后筆者想強(qiáng)調(diào)的是SAP容災(zāi)備份不只是一個(gè)架構(gòu),而是真正要具備接管支持核心業(yè)務(wù)系統(tǒng)能力,從而我們認(rèn)為一個(gè)合格的SAP容災(zāi)系統(tǒng),應(yīng)該具備:
1. 合理的RPO及RTO,RPO和RTO并不是越小越好,而是要適合企業(yè)現(xiàn)狀
2. 容災(zāi)系統(tǒng)的可用性,容災(zāi)是養(yǎng)兵千日用兵一時(shí),在真正啟用前,需要有效方式確保從底層硬件到系統(tǒng)層可靠性
3. 定期容災(zāi)演練,一方面檢查系統(tǒng),另一方面讓IT人員熟悉恢復(fù)操作
如果有相應(yīng)的SAP容災(zāi)上云需求,歡迎聯(lián)系微軟Azure銷售人員。
Ken Li
微軟(中國)有限公司
云解決方案架構(gòu)師
具有多年SAP項(xiàng)目實(shí)施經(jīng)驗(yàn),對于SAP系統(tǒng)上云的最佳實(shí)踐設(shè)計(jì)以及部署擁有豐富的經(jīng)驗(yàn)。企業(yè)上云直升機(jī)團(tuán)隊(duì)深度參與SAP on Azure解決方案,為客戶提供Azure云平臺(tái)的最佳實(shí)踐,實(shí)現(xiàn)更好更快更高質(zhì)量的定制業(yè)務(wù)應(yīng)用場景。更多咨詢信息,請聯(lián)系 CloudCrew@microsoft.com.