微軟生成式AI用Azure ND H100 v5 VM正式上線

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時間:2023-08-10
3104
微軟今年3月宣布開放預(yù)覽的生成式人工智能專用虛擬機(jī)Azure ND H100 v5,現(xiàn)在正式上線,該虛擬機(jī)配備Nvidia H100 Tensor Core GPU與低延遲網(wǎng)絡(luò)設(shè)備,可用于執(zhí)行復(fù)雜的生成式人工智能運(yùn)算。另外,微軟也擴(kuò)大Azure OpenAI服務(wù)規(guī)模,添加在澳洲、亞洲和歐洲云計算地區(qū)提供服務(wù)。

inquiry_form_azure_nd_h100_v5_virtual_machines.jpg

微軟今年3月宣布開放預(yù)覽的生成式人工智能專用虛擬機(jī)Azure ND H100 v5,現(xiàn)在正式上線,該虛擬機(jī)配備Nvidia H100 Tensor Core GPU與低延遲網(wǎng)絡(luò)設(shè)備,可用于執(zhí)行復(fù)雜的生成式人工智能運(yùn)算。另外,微軟也擴(kuò)大Azure OpenAI服務(wù)規(guī)模,添加在澳洲、亞洲和歐洲云計算地區(qū)提供服務(wù)。

Azure ND H100 v5的特色在于,配備8個Nvidia在2023年新推出的數(shù)據(jù)中心用H100 Tensor Core GPU,以及采用低延遲Quantum-2 ConnectX-7 InfiniBand網(wǎng)絡(luò)設(shè)備,每個虛擬機(jī)可擁有高達(dá)3.2 Tb/s的跨節(jié)點(diǎn)帶寬,相當(dāng)于每個GPU可獲得400 Gb/s的帶寬,確??鏕PU的運(yùn)算性能。

Azure ND H100 v5的CPU使用第4代Intel Xeon Scalable處理器,而GPU與主機(jī)接口使用PCIe Gen5,每個GPU可以獲得64GB/s的帶寬,進(jìn)一步減少CPU和GPU間的傳輸瓶頸。

有了H100 Tensor Core GPU的加持,ND H100 v5運(yùn)算性能較上一代的虛擬機(jī)更好,由于H100支持FP8浮點(diǎn)數(shù)數(shù)據(jù)類型,因此ND H100 v5在矩陣運(yùn)算上,性能可為上一代ND A100 v4的6倍,執(zhí)行BLOOM 175B端到端大型語言模型推理,速度則是上一代的2倍。

盤點(diǎn)Nvidia在其2022 GTC大會中,預(yù)告將會部署H100執(zhí)行實(shí)例的云計算供應(yīng)商,目前正式推出的服務(wù)有AWS的Amazon EC2 P5,以及微軟Azure ND H100 v5,而Google云計算的A3,還有甲骨文OCI采用H100的執(zhí)行實(shí)例則仍在預(yù)覽測試階段。

除了Azure ND H100 v5虛擬機(jī)的正式推出外,微軟也宣布擴(kuò)大提供OpenAI GPT-4和GPT-35-Turbo的Azure OpenAI服務(wù),除了原本的美國東部、美國中南、法國中部和西歐,現(xiàn)在更增加了澳洲東部、加拿大東部、美國東部2、日本東部和英國南部地區(qū)。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家