Azure簡(jiǎn)化深度學(xué)習(xí)函數(shù)庫(kù)DeepSpeed軟硬件堆棧配置,超大規(guī)模模型訓(xùn)練變簡(jiǎn)單

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2022-08-02
2396
微軟強(qiáng)化Azure對(duì)超大型機(jī)器學(xué)習(xí)模型訓(xùn)練的支持度,現(xiàn)在用戶可以使用深度學(xué)習(xí)函數(shù)庫(kù)DeepSpeed和1024個(gè)A100 GPU,來執(zhí)行兆級(jí)參數(shù)模型的訓(xùn)練。

azure_empowers_easy-to-use_high-performance_and_hyperscale_model.jpg

微軟強(qiáng)化Azure對(duì)超大型機(jī)器學(xué)習(xí)模型訓(xùn)練的支持度,現(xiàn)在用戶可以使用深度學(xué)習(xí)函數(shù)庫(kù)DeepSpeed和1024個(gè)A100 GPU,來執(zhí)行兆級(jí)參數(shù)模型的訓(xùn)練。

近年基于Transformer的大規(guī)模深度學(xué)習(xí)技術(shù),有了長(zhǎng)足的進(jìn)展,在5年之間,從最初只有數(shù)百萬參數(shù)的Transformer模型,到現(xiàn)在Megatron-Turing已具有5,300億個(gè)參數(shù),這之間模型參數(shù)量增長(zhǎng)了數(shù)個(gè)量級(jí),而企業(yè)對(duì)于訓(xùn)練和調(diào)校這些大型模型的需求也逐漸增長(zhǎng)。

過去用戶要訓(xùn)練這類大規(guī)模模型,需要配置和維護(hù)一個(gè)復(fù)雜的分布式訓(xùn)練基礎(chǔ)設(shè)施,微軟提到,這些工作通常有一些手動(dòng)步驟且容易出錯(cuò),因此在可用性和性能表現(xiàn)上并不佳。

而現(xiàn)在微軟用戶可以使用Azure上的DeepSpeed,來應(yīng)對(duì)大規(guī)模人工智能訓(xùn)練。用戶可以使用推薦的Azure機(jī)器學(xué)習(xí)配置,或是利用Bash腳本以虛擬機(jī)擴(kuò)展集為基礎(chǔ)的環(huán)境執(zhí)行。DeepSpeed是微軟在2020年發(fā)布的開源深度學(xué)習(xí)訓(xùn)練優(yōu)化函數(shù)庫(kù),該函示庫(kù)使用內(nèi)存優(yōu)化技術(shù)ZeRO,改善大型模型訓(xùn)練的規(guī)模、速度、成本和可用性。

微軟采用全端優(yōu)化的方式,將所有訓(xùn)練必要的硬件、操作系統(tǒng)、虛擬機(jī)鏡像文件,還有包含PyTorch、DeepSpeed、ONNX Runtime,與各種Python組件的Docker鏡像文件,以及Azure機(jī)器學(xué)習(xí)API,經(jīng)過優(yōu)化、集成和測(cè)試,使其具有良好的性能和可擴(kuò)展性,并且讓用戶不需要處理其復(fù)雜性。

6213ff53-aeda-4961-954e-81692ce0b768.jpg

在經(jīng)優(yōu)化的Azure DeepSpeed堆棧上,用戶可以訓(xùn)練1兆甚至是2兆參數(shù)的超大型模型,而且無論是模型的大小和GPU數(shù)量的增加,都提供了幾乎線性的可擴(kuò)展性,微軟提到,Azure和DeepSpeed打破GPU內(nèi)存的限制,使得用戶可以更簡(jiǎn)單地訓(xùn)練兆級(jí)參數(shù)模型。

原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
Azure Arc為企業(yè)構(gòu)建安全的云基礎(chǔ)
隨著人工智能技術(shù)持續(xù)重塑企業(yè)運(yùn)營(yíng)方式,企業(yè)需要能夠處理海量數(shù)據(jù)的系統(tǒng),以支持實(shí)時(shí)洞察,同時(shí)幫助他們應(yīng)對(duì)跨IT和OT環(huán)境(包括云端、邊緣和本地)中運(yùn)營(yíng)、應(yīng)用、數(shù)據(jù)和基礎(chǔ)設(shè)施的協(xié)作難題。
Azure
微軟云
云服務(wù)
2024-12-17
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來
釋放.NET 9和Azure的AI技術(shù)與云計(jì)算潛力:更快、更智能、面向未來
.NET 9現(xiàn)已正式發(fā)布,它為.NET平臺(tái)的發(fā)展掀開了嶄新的一頁(yè),突破了性能、云原生開發(fā)和AI技術(shù)集成的邊界。
Azure
微軟云
云服務(wù)
2024-12-16
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
Azure網(wǎng)絡(luò)管理現(xiàn)已具備智能Microsoft Copilot副駕駛能力
智能Microsoft Copilot副駕駛for Azure網(wǎng)絡(luò)服務(wù)現(xiàn)已推出公共預(yù)覽版。
Azure
微軟云
云服務(wù)
2024-12-10
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
Microsoft Fabric功能更新,借助AI驅(qū)動(dòng)的數(shù)據(jù)平臺(tái)加速應(yīng)用創(chuàng)新
一年前,我們正式推出了一款端到端數(shù)據(jù)平臺(tái),旨在幫助組織推動(dòng)人工智能轉(zhuǎn)型,并重新定義數(shù)據(jù)的連接、管理和分析方式。
Azure
微軟云
云服務(wù)
2024-12-09
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家