不算久等!阿里云基礎(chǔ)設(shè)施算力又升級了!
本次被“翻牌”的是第七代高主頻ECS企業(yè)級實例、含光800云服務(wù)器商用以及新一代容器(神龍)服務(wù)。
還記得去年杭州云棲,搭載自研第二代神龍云服務(wù)器架構(gòu)的六代ECS已是眾望所歸;如今搭載第三代神龍云服務(wù)器架構(gòu)的高主頻七代,在整機算力上卻是前輩的2.6倍。
究竟2.6倍之多源于何處?
很關(guān)鍵的一點,就是搭載了最新一代英特爾?至強?可擴展處理器,據(jù)說這波技術(shù)嘗試就連英特爾自己都還沒來得及發(fā)布。
此外,由于得到集大成的第三代神龍架構(gòu)助力,七代高主頻實例在性能與穩(wěn)定性上都有了顯著提升。
大到底層存儲、網(wǎng)絡(luò),虛擬化技術(shù)升級;小到搭載的云盤性能、每秒鐘操作的IO次數(shù)以及吞吐能力等均是可圈可點。
別的不說,單從支持vCPU數(shù)量就高達192個。
配套的內(nèi)存的頻率也達到了3200兆赫茲。
七代首次支持50Gx2網(wǎng)絡(luò)架構(gòu),每秒鐘PPS高達2400萬,果斷支持大幀傳輸之外,實例帶寬最高提升5倍之多,物盡其用。
整機存儲吞吐從每秒2GB上升到4GB,轉(zhuǎn)發(fā)提升到60萬IOPS,寫延時最多下降20%以上,性能逼近裸盤,值得期待。
出于安全性和穩(wěn)定性,阿里云還通過進一步完善no QEMU極致優(yōu)化來降低七代實例抖動。
再配合Aliyun Linux 2 LTS,大力將啟動速度最高提升60%;就算是正在運行時,也可多達30%。
強勢引入硬件級別QOS能力,保障關(guān)鍵業(yè)務(wù)。
如此看來果然是又快又好的節(jié)奏。
據(jù)悉由于算力與穩(wěn)定性并存的優(yōu)勢,高主頻七代ECS尤其適用半導(dǎo)體仿真設(shè)計、工業(yè)仿真、游戲、高性能數(shù)據(jù)庫和渲染等對計算力要求較高的場景。
截至發(fā)稿前,量子位獲悉第七代ECS企業(yè)級高主頻實例以及新一代彈性裸金屬云服務(wù)器,目前都已啟動邀測。
從六到七,技術(shù)嘗試助力成本降低是關(guān)鍵
從六到七,算力與穩(wěn)定性等確實都上了好幾層臺階。
但阿里云彈性計算首席架構(gòu)師蔡俊杰卻透露,其實除了市場需求與使用性能等硬性催化劑之外,成本考量也毋庸置疑成了關(guān)鍵所在。
簡單說,這款七代高主頻實例更省錢了!
當(dāng)然,這種成本節(jié)省是對標(biāo)六代高主頻來說的,而不是銷路甚好的第六代增強實例。
成本降低有門道,先從更好地定制CPU說起。
據(jù)悉,阿里云這次在七代的芯片選型上做了大量工作。
通過洞察幾百萬客戶實際使用云服務(wù)器的情況,從內(nèi)存帶寬、緩存以及頻率要求,包括用戶應(yīng)用的性能甜點角度做了大量的數(shù)據(jù)分析。
“通常情況下,價格高則性能強,但如果需要用戶提升百分之一的性能卻需要cover百分之二十的成本增幅來換的話,實在不劃算,當(dāng)然這還是在迫切需要提升的前提下?!?/span>
阿里云彈性計算方面最后定制的這一款CPU,在保障符合用戶需求的高性能的同時,綜合成本上降低了不少。
更重要的一點,為了低成本的需要,技術(shù)研發(fā)在服務(wù)器設(shè)計上竟然還展開了新路線的探索。
或許大家可能知曉,主流的云服務(wù)器過去通常采用的是二路服務(wù)器,即一個服務(wù)器中攜帶兩顆CPU。
如今的七代創(chuàng)新性選擇了更加高密度部署的四路服務(wù)器制式,也就是同時攜帶四顆CPU。
不但是單體計算性能得到顯著提升,從整機的性能角度上也有很大飛躍。
很明顯,四路服務(wù)器帶來的好處,每顆均攤到整體基礎(chǔ)設(shè)施的成本,相比之前確實下降不少。
但蔡俊杰透露,盡管成本下降的背后,是運維和穩(wěn)定性難度的急劇上升。
由于服務(wù)器上的器件增多,散熱就成為亟待攻克的關(guān)鍵一環(huán)。
同時,如何保障所有器件能夠正常工作并在性能穩(wěn)定的基礎(chǔ)上達成目標(biāo),是個挑戰(zhàn)。畢竟由于CPU和內(nèi)存增加了一倍,故障概率也就同時增加了一倍。
無論何種新品的研發(fā)都不希望通過犧牲穩(wěn)定性來降低成本,所以為了保障實例的穩(wěn)定性,阿里云做了很多工作。
得益于阿里云成熟的主動運維體系,包括極高的故障探測和預(yù)測能力、世界領(lǐng)先的熱遷移技術(shù)等,七代ECS將繼續(xù)承諾全球第一的穩(wěn)定性SLA,單實例達到99.975%。
七代高主頻ECS企業(yè)級實例在成本上的精益求精,在某種程度上也應(yīng)承了更多用戶在云服務(wù)器的使用上越發(fā)關(guān)注成本優(yōu)化的現(xiàn)實。
2020年的疫情突襲,帶來源于全球經(jīng)濟環(huán)境的諸多挑戰(zhàn)。
越來越多的云服務(wù)器使用者會在選型以及使用方式上表現(xiàn)出更加精細(xì)化的態(tài)度,畢竟大家都希望在有限的成本投入中得到最大程度的資源利用。
這一點,作為云服務(wù)器未來發(fā)展的可預(yù)測趨勢之一,得到更廣泛的關(guān)注也是無可厚非的。
如何更好理解“新一代容器服務(wù)”?
談及新一代容器服務(wù),“基于神龍架構(gòu),阿里云還升級了容器服務(wù)的算力,同等條件下,新一代容器服務(wù)可為客戶縮減50%的計算成本?!钡恼摂嗷蛟S你也聽說過。
基于此,蔡俊杰還異國連線算了筆賬。
其實這樣的判斷并不僅僅基于被廣泛提及的神龍架構(gòu),而是使用裸金屬服務(wù)器的形態(tài)來支持容器場景帶來的整體成本的大幅降低。
以第七代高主頻ECS為例,原本四路服務(wù)器為整機算力帶來極大提升,作用在容器層面,有什么額外好處?
直接說就是做到將原本分散在各個小機器中的容器實例高效聚集起來,節(jié)省算力成本的同時更好利用容器服務(wù)。
試想一下,對于具備32個vCPU算力的小型服務(wù)器來說,假設(shè)每臺上運行的操作系統(tǒng)需要耗費1個vCPU和500兆內(nèi)存,那么6臺就要耗費6個vCPU和3G內(nèi)存。
如果換成第七代高主頻ECS支持192個vCPU的情況,光操作系統(tǒng)的消耗就只有原來的六分之一。
更重要的一點,在此種部署環(huán)境中容器服務(wù)的超賣比優(yōu)點得到顯現(xiàn),即越來越多的應(yīng)用可以達成錯峰,帶來部署密度的增加,數(shù)量上的保障。
性能方面,現(xiàn)實表明,神龍裸金屬服務(wù)器與容器相結(jié)合在阿里經(jīng)濟體內(nèi)部各種場景的多重測試中,已經(jīng)可達到整體性能20%的提升。
哪怕在用戶群體中驗證,由于底層IO與存儲的軟硬一體化加速機制,帶來30%的性能優(yōu)勢也是可以期待的。
如果具備足夠的技術(shù)前瞻性的話,或許會發(fā)現(xiàn),云服務(wù)器的另一個未來觸發(fā)點,如此說來竟是云原生無疑。
可能這也是阿里云率先在業(yè)界推出彈性裸金屬這樣的創(chuàng)新產(chǎn)品形態(tài)的關(guān)鍵所在。
云原生是未來,與容器結(jié)合是必然。
天生屬性即適合與K8S容器編排引擎打配合,以求實現(xiàn)服務(wù)serveless的彈性計算,可以做到讓更多用戶聚精會神關(guān)心應(yīng)用怎么跑,而不是底層架構(gòu)怎么做,彈性容器實例ECI就是為serverless而生的新生代“云服務(wù)器”。
當(dāng)然,花開兩朵各表一枝。
如何做到部署更輕量、啟動更迅速、并發(fā)能力更強悍等,也對云服務(wù)器的整體生產(chǎn)鏈路提出了更高要求。
蔡俊杰認(rèn)為,在極短的時間內(nèi)準(zhǔn)備好計算、網(wǎng)絡(luò)以及存儲等資源,通過整鏈路的優(yōu)化升級達到極致服務(wù)的狀態(tài),來高安全性滿足復(fù)雜的云原生場景,一個字“難”。
如此看來,安全穩(wěn)定地提供符合云原生使用體驗的基礎(chǔ)設(shè)施能力,想必也是各大云計算入局者競相探討的要務(wù)之一。
含光800云服務(wù)器因何而來?
日前,阿里云正式官宣推出搭載含光800推理芯片的云服務(wù)器,標(biāo)志著自研含光芯片正式大規(guī)模商業(yè)化的beginning。
從芯片進化到云服務(wù)器,本質(zhì)上,阿里云鉚足勁頭讓更多已經(jīng)上云或正在上云路上的小伙伴們嘗鮮含光800的超強算力。
助力云上AI推理,這波操作相當(dāng)別致。
量子位獲悉,由于配備了阿里平頭哥自研神經(jīng)網(wǎng)絡(luò)加速芯片含光800,該款云服務(wù)器提供了全球最高單芯片AI推理性能,有著同類處理器的數(shù)十倍性能之高。
另外還針對業(yè)務(wù)場景達成了深度優(yōu)化,例如廣泛適用于圖像搜索、場景識別、視頻內(nèi)容識別、自然語言處理等業(yè)務(wù)。
一句話,算力表現(xiàn)出挑且推理能力高性價。
好的產(chǎn)品都要從自身用起,例如阿里云城市大腦交通信號機系統(tǒng)。
自從使用了含光800服務(wù)器處理車輛檢測、品牌識別、車牌識別等算法模型,單張含光800全鏈路竟能夠支持100路實時視頻的分析和特征結(jié)構(gòu)化數(shù)據(jù)的提取。
結(jié)果呢?相比搭載GPU,性能提升超過5倍。
多方了解到,含光云服務(wù)器還是基于阿里云自研的神龍云服務(wù)器架構(gòu),目前為用戶提供彈性裸金屬加速實例。
其中開發(fā)工具采用阿里平頭哥HGAI自動化開發(fā)工具,支持主流深度學(xué)習(xí)框架TensorFlow、Caffe、MXNet和ONNX。
就在今年3月,阿里云飛天AI加速引擎AIACC與含光800的組合,擊敗Google不說,還拿下了斯坦福大學(xué)DAWNBench ImageNet推理成本的世界第一。
據(jù)了解其能效比達500IPS/W,是第二名的3.3倍,且被作為阿里云軟硬件一體化極致性能優(yōu)化的典型案例津津樂道。
談及軟硬件一體化的能力所帶來的效果,無論是國外的云計算巨頭AWS,還是我們身邊的阿里云,具體產(chǎn)品的性能飛躍,甚至一年翻一番的速率是有目共睹的。
如果從技術(shù)角度,這種軟硬一體的自研能力很大可能是未來3-5年,各家都十分重視的路線之一并被爭相效仿,云服務(wù)器自然不例外。
此外含光800云服務(wù)器的商用也正是兼顧軟硬一體能力的同時,將解決云場景下的機器學(xué)習(xí)問題作為重點。
由此推斷,將云與數(shù)據(jù)以及人工智能緊密結(jié)合,用云的視角服務(wù)更多不同的技術(shù)場景化,或許將成為云服務(wù)器場景進化的必然路徑。
如今,云服務(wù)器作為云計算基礎(chǔ)設(shè)施的大底盤,阿里云經(jīng)濟體“全面上云”的號角業(yè)已達成。
作為阿里云自身的技術(shù)基礎(chǔ),關(guān)于云服務(wù)器能力構(gòu)建,更多被認(rèn)為是關(guān)乎云服務(wù)商產(chǎn)品能力的命脈。
隨著云計算自身形態(tài)的多樣化,實踐部署的親民性與無處不在,包括國內(nèi)對自研國產(chǎn)化核心競爭力的重視日益提升等,可以判斷未來很長一段時間,該領(lǐng)域不會出現(xiàn)重要性層面的顛覆式變化。
可以肯定,云服務(wù)器仍是兵家必爭之地,無疑。
附:采訪嘉賓簡介
作者系網(wǎng)易新聞·網(wǎng)易號“各有態(tài)度”簽約作者