重磅發(fā)布!飛天智算平臺+全球最大智算中心

來源:阿里云
作者:阿里云
時間:2022-08-31
2360
剛剛,阿里云宣布正式推出全棧智能計算解決方案“飛天智算平臺”,并啟動兩座超大規(guī)模智算中心,為科研、公共服務(wù)和企業(yè)機構(gòu)提供強大的智能計算服務(wù),可將計算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。

剛剛,阿里云宣布正式推出

全棧智能計算解決方案“飛天智算平臺”

并啟動兩座超大規(guī)模智算中心

為科研、公共服務(wù)和企業(yè)機構(gòu)

提供強大的智能計算服務(wù)

可將計算資源利用率提高3倍以上

AI訓(xùn)練效率提升11倍,推理效率提升6倍

我們希望通過開放飛天智算平臺,為各行各業(yè)提供強大的融合算力、高效的全鏈路智能服務(wù),同時在可支撐多種指令集芯片的基礎(chǔ)上,大幅提升計算效率,并通過綠色低碳方面的能力,大大降低AI訓(xùn)練能耗。為各領(lǐng)域創(chuàng)新提供更高效、更開放、更綠色的智能計算服務(wù)。

阿里云智能全球銷售總裁蔡英華

640.jpg

01

支撐建設(shè)超級智算中心

飛天智算平臺源于阿里巴巴內(nèi)部廣泛實踐,也源于廣泛的產(chǎn)業(yè)智能實踐。目前,該平臺正在支撐建設(shè)兩座超大規(guī)模智算中心。

張北智算中心建設(shè)規(guī)模為12 EFLOPS(每秒1200億億次浮點運算)AI算力。在云端,張北智算中心支撐AI預(yù)訓(xùn)練大模型、AI Earth、數(shù)字人等前沿AI應(yīng)用,將成為全球最大的智算中心。

烏蘭察布智算中心建設(shè)規(guī)模為3 EFLOPS(每秒300億億次浮點運算)AI算力,位于“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點,采用自然風(fēng)冷、AI調(diào)溫等綠色技術(shù),實現(xiàn)綠色低碳。

640.png

02

全面開放飛天智算平臺

飛天智算平臺是阿里云最新發(fā)布的全棧智能計算解決方案,提供公共云和專有云兩種模式,為各類科研和智能企業(yè)機構(gòu)提供強大的智能計算服務(wù)。

通過先進的技術(shù)架構(gòu),飛天智算平臺實現(xiàn)了90%的千卡并行計算效率,可將算力資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。

突破計算效率極限

飛天智算平臺采用先進的技術(shù)架構(gòu),將衡量算力效率的核心指標“千卡并行計算效率”,從傳統(tǒng)架構(gòu)的40%提升至90%,可將算力資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。

支持“一云多芯”

飛天智算平臺提供基于阿里云磐久基礎(chǔ)設(shè)施的融合算力和大數(shù)據(jù)AI一體化平臺整體解決方案,可以運行在X86、GPU、ARM等多種芯片類型的服務(wù)器上,實現(xiàn)“一云多芯”,支持多種處理器混合部署、統(tǒng)一調(diào)度,并可進行應(yīng)用優(yōu)化,部分性能提升100%以上。

高效智能服務(wù)

開發(fā)人員可以在飛天智算平臺上進行數(shù)據(jù)存儲、數(shù)據(jù)治理、數(shù)據(jù)分析、模型開發(fā)、模型訓(xùn)練與推理的工作。并提供了預(yù)訓(xùn)練模型,以及語音,圖像、自然語言處理、決策等領(lǐng)域的模型能力,以方便開發(fā)者更好的加速AI應(yīng)用的開發(fā)。

綠色低碳

飛天智算在技術(shù)減排、能源結(jié)構(gòu)優(yōu)化、區(qū)域布局優(yōu)化、供應(yīng)鏈減碳以及資源利用優(yōu)化五個方面來降低單位算力的碳排放。在技術(shù)減排方面,通過液冷、電源技術(shù)以及智能運維等方式降低能耗,PUE最低可達1.09。

640 (1).png

阿里云浸沒式液冷集群

03

體系化的技術(shù)創(chuàng)新

智能計算不同于通用型計算,需要海量數(shù)據(jù)對AI模式進行訓(xùn)練,算力被損耗在數(shù)據(jù)遷移、同步等環(huán)節(jié),千卡以上規(guī)模的算力輸出最低往往僅有40%左右。這導(dǎo)致了智能算力成本高昂,制約了產(chǎn)業(yè)發(fā)展。

阿里云通過體系化的技術(shù)創(chuàng)新,改變了智能計算的損耗難題,將千卡并行計算效率提升至90%以上。

·在網(wǎng)絡(luò)技術(shù)上:阿里云采用高性能RDMA網(wǎng)絡(luò),實現(xiàn)端對端最低2微妙延遲。

·在通信技術(shù)上:阿里云自研的無阻塞通信技術(shù),讓計算過程中的數(shù)據(jù)交換速度提升了5倍以上。

·在存儲技術(shù)上:自研的IO加速器讓數(shù)據(jù)存取實現(xiàn)最高10倍性能提升。

·在大數(shù)據(jù)AI開發(fā)層:阿里云提供分布式訓(xùn)練框架,并通過API對分布式策略進行自動組合和調(diào)優(yōu),將訓(xùn)練效率提升了11倍以上。

一站式AI計算開發(fā)服務(wù):阿里云為用戶提供了一站式的通用推理優(yōu)化工具,對算法模型進行量化、剪枝、稀疏化、蒸餾等操作,將推理效率提升6倍以上。

640 (2).png

阿里云飛天智算中心

04

構(gòu)建智算生態(tài)產(chǎn)業(yè)圈

如今,飛天智算平臺已在阿里內(nèi)部廣泛應(yīng)用,支撐達摩院前沿AI和電商智能技術(shù)發(fā)展,并服務(wù)了小鵬汽車、深勢科技、上汽集團、中國氣象局、南方電網(wǎng)等機構(gòu)和企業(yè),支撐自動駕駛、新藥研發(fā)、氣象預(yù)測、工業(yè)能源等行業(yè)大幅提升AI訓(xùn)練效率。

在自動駕駛領(lǐng)域

小鵬汽車:基于飛天智算在烏蘭察布建設(shè)智算中心“扶搖”,算力規(guī)模達600PFLOPS,是國內(nèi)最大的自動駕駛智算中心,將自動駕駛模型訓(xùn)練提速近170倍。

毫末汽車:基于飛天智算,實現(xiàn)128卡并行效率超96%,使自動駕駛模型訓(xùn)練成本降低62%,訓(xùn)練速度提升110%,讓模型迭代周期大幅縮短。

在生命科學(xué)領(lǐng)域

深勢科技采用飛天智算平臺之后,將集群性能優(yōu)化提升超過100%,讓分子動力學(xué)仿真模擬訓(xùn)練效率提升了5倍以上。

在工業(yè)領(lǐng)域

智己汽車:運用高性能計算將工業(yè)仿真的效率提升了25%,智能駕駛訓(xùn)練效率提升了70%,加速了新車型的研發(fā)上市。

山東德州電力:通過AI進行復(fù)核預(yù)測,準確率達到了98%,耗時從1小時縮短至幾分鐘。

在城市治理領(lǐng)域

四川成宜高速:通過數(shù)字孿生進行車路協(xié)同優(yōu)化使事故率降低60%。

重慶水務(wù):通過遙感數(shù)據(jù)與仿真推演實現(xiàn)水利調(diào)度預(yù)測準確性高達95%;

南方電網(wǎng)與中國氣象局:利用智算能力提升氣象預(yù)報的準確性與穩(wěn)定性。

原文鏈接:點擊前往 >
版權(quán)說明:本文內(nèi)容來自于阿里云,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家