華為云聯(lián)接與協(xié)同業(yè)務(wù)領(lǐng)域總裁薛浩
視頻的理想與現(xiàn)實
據(jù)科學(xué)家研究,人類83%的信息主要來源于視覺。人們需要信息交流,彼此溝通,而視頻,則是人類社會相互聯(lián)接的最好方式。
在我們的概念里,視頻天然就是真實世界的客觀還原,高清晰度,自然流暢;視頻天然就是實時互動的,沒有延遲,自由交互;視頻自然融合,觀看、互動、交互靈活組合,在各種終端中任意流轉(zhuǎn),無縫體驗;視頻也充滿了無盡的想象力,立體視角、虛實交互、沉浸式體驗,如夢如幻、激動人心……
但是,現(xiàn)實卻有些骨感。我們看到,由于技術(shù)和資源等條件限制,視頻業(yè)務(wù)場景割裂,直播、連麥互動、視頻會議、視頻監(jiān)控等各有各的網(wǎng)絡(luò),各有各的架構(gòu)體系,融合場景難以滿足,開展新的VR/AR業(yè)務(wù)也困難重重;視頻體驗遠沒有達到要求,普通直播延遲大于3秒,主播和連麥用戶不同步,還經(jīng)常出現(xiàn)卡頓、花屏等現(xiàn)象;同時視頻業(yè)務(wù)成本高昂,計算、存儲等基礎(chǔ)設(shè)施投資巨大,帶寬流量費用呈線性增長。
新基建促進ICT基礎(chǔ)設(shè)施飛躍發(fā)展,視頻網(wǎng)絡(luò)迎來升級變革
視頻業(yè)務(wù)產(chǎn)業(yè)鏈,貫穿了從采集接入、內(nèi)容處理、分發(fā)傳輸、播放顯示的全生命周期過程。它背后的核心支撐,是一張基于視頻流的媒體處理和分發(fā)網(wǎng)絡(luò)。要提供這樣的一張網(wǎng)絡(luò),并非易事,首先有三大門檻需要跨越。
網(wǎng)絡(luò)覆蓋范圍要足夠?qū)拸V:視頻本身是資源型業(yè)務(wù),動輒上千個邊緣節(jié)點,對計算資源、網(wǎng)絡(luò)資源要求極高,資源的投入、網(wǎng)絡(luò)的穩(wěn)定可靠運行、以及如何有效提升資源效率,成本與效率的平衡是首要考慮的問題。
對端的整合以及端云協(xié)同能力:視頻網(wǎng)絡(luò)需要支持五花八門、品類繁多的終端接入,兼容各種芯片、終端型號和操作系統(tǒng)版本。一個端側(cè)SDK要支持至少上千終端型號,大量驗證測試,并且要持續(xù)更新。
音視頻技術(shù)能力:如何持續(xù)提升編解碼效率、如何獲得更低的時延、更高清的視頻質(zhì)量,還有在地鐵、電梯、高鐵等弱網(wǎng)環(huán)境下,如何保持互通、清晰流暢。
除此之外還需要考慮如何應(yīng)對突發(fā)大容量、如何支持億級并發(fā)、在公網(wǎng)接入條件下如何保障接入安全、防網(wǎng)絡(luò)攻擊等諸多挑戰(zhàn),這張視頻網(wǎng)絡(luò)的背后,是研發(fā)技術(shù)、基礎(chǔ)資源、運營運維的高門檻投入。
國家提出了新基建戰(zhàn)略,ICT基礎(chǔ)設(shè)施快速發(fā)展,視頻發(fā)展也迎來了新機遇。5G的到來,解決了視頻傳輸?shù)拇髱挕⒋罅髁康膯栴},延遲大幅降低;云計算帶來了算力的極大增強,視頻的生產(chǎn)、渲染和處理更快、效率更高;邊緣、分布式技術(shù)的發(fā)展,帶來了本地的超低時延,流量成本大幅降低。視頻是5G時代的風(fēng)口業(yè)務(wù),網(wǎng)絡(luò)的升級,給視頻業(yè)務(wù)帶來了更好的體驗,更多更豐富的業(yè)務(wù)創(chuàng)新機遇也將到來。
視頻業(yè)務(wù)正在發(fā)生巨大變化:從單向的播放變?yōu)殡p向互動,超低延遲成為基本特征,進入毫秒時代;“云原生”成為趨勢,生產(chǎn)上云、渲染上云、處理上云、分發(fā)上云,云服務(wù)成為基本模式;AI技術(shù)在視頻領(lǐng)域規(guī)模應(yīng)用,帶來更極致的體驗和更多創(chuàng)新,如人臉識別、背景虛化、智能鑒黃、實時字幕、智能監(jiān)控預(yù)警等。
面向未來的視頻網(wǎng)絡(luò),我們認為應(yīng)該具備幾個關(guān)鍵特征:第一,極低時延,端到端延遲>200毫秒;其次,超高的質(zhì)量,4K/8K超高清,在弱網(wǎng)條件下依然自然流暢;第三,統(tǒng)一的融合網(wǎng)絡(luò),直播觀看、連麥互動、會議、監(jiān)控等融合場景統(tǒng)一支持,無需切換;第四,超大的容量,可以支持千人互動、百萬觀看、億級并發(fā)的超大規(guī)模;第五,開放互聯(lián),與運營商5G網(wǎng)絡(luò)、各種智能終端無縫協(xié)同,并保持前向兼容;第六,成本節(jié)省,基礎(chǔ)設(shè)施、帶寬以及運維成本大幅降低。
以RTC為代表的視頻技術(shù)快速發(fā)展,成為5G時代視頻業(yè)務(wù)基礎(chǔ),重塑行業(yè)體驗
RTC(實時音視頻),主要基于實時通信技術(shù),對音頻/視頻信號進行處理、轉(zhuǎn)發(fā)和傳輸,以前主要用在視頻通信類業(yè)務(wù)上,例如會議、客服等應(yīng)用。隨著5G時代的到來,ICT基礎(chǔ)設(shè)施的發(fā)展,新業(yè)務(wù)需求的涌現(xiàn),實時音視頻被重新認知和定義,并成為業(yè)界創(chuàng)新熱點,創(chuàng)新應(yīng)用場景層出不窮,例如互動直播、在線教育、遠程醫(yī)療、企業(yè)在線營銷、VR/AR虛實互動、物聯(lián)網(wǎng)應(yīng)用等。
全新的實時音視頻服務(wù),有三個最核心的改變。
第一,全場景、一張網(wǎng)。基于視頻流融合,一張網(wǎng)支持所有場景業(yè)務(wù),播放、交互、連麥、監(jiān)控等業(yè)務(wù)互通,無縫流轉(zhuǎn),突破技術(shù)限制,隨需擴展,支持千人互動、億級并發(fā)。
第二,全實時、低延遲。實時觀看,播放時延小于200毫秒;實時互動,雙向交互端到端時延小于200毫秒;實時操作,操控指令響應(yīng)時長小于30毫秒。
第三,可擴展、全流程AI。基于統(tǒng)一框架,提供豐富多維的AI能力,AI插件隨需使用。AI融入視頻采、編、存、傳、顯全生命周期過程,智能識別、智能鑒黃、美顏降噪、虛擬背景、智能路由傳輸,智能檢測預(yù)警……AI讓視頻生產(chǎn)和處理更加高效,帶給用戶更為極致的體驗。
全新的實時音視頻服務(wù)帶來了業(yè)務(wù)、體驗和技術(shù)的升級。直播、連麥、會議靈活組合和隨時切換,更多業(yè)務(wù)創(chuàng)新,如VR/AR、全息互動等,實現(xiàn)業(yè)務(wù)升級;用戶對延遲無感、邊看邊互動,精準(zhǔn)操控作業(yè),體驗升級;多套網(wǎng)絡(luò)合一,靈活擴展,資源效率至少提升30%,運維效率提升50%,技術(shù)升級。
視頻網(wǎng)絡(luò)架構(gòu)也發(fā)生了根本性改變,從中心式、樹狀結(jié)構(gòu)、層層分發(fā)的模式,改變?yōu)榫W(wǎng)狀、去中心化、自適應(yīng)Mesh結(jié)構(gòu);從專網(wǎng)、集中式設(shè)備模型,改變?yōu)榉植际?,基于邊緣部署,隨需擴展和就近接入;基于目的地尋址,多路徑精準(zhǔn)分發(fā),管道流量模型改變;實時監(jiān)控、機器學(xué)習(xí)、智能調(diào)度,自動選擇最佳路徑,極致效率。
使能千行百業(yè)創(chuàng)新,大視頻創(chuàng)新機遇正奔涌而來
RTC的注入,和5G、云計算、AI等技術(shù)一起交疊應(yīng)用,為視頻提供更有價值、更有肥力的土壤,使能千行百業(yè)創(chuàng)新,大視頻創(chuàng)新機遇正奔涌而來。
·互動文娛行業(yè)升級:通過實時音視頻服務(wù),直播業(yè)務(wù)真正實現(xiàn)毫秒級實時互動體驗,并帶來更多新玩法。主播間互動無延遲感知,參與人數(shù)無限制,所有觀眾可實時互動、自由上線連麥,還可以與朋友們一起邊觀看比賽邊實時互動交流,同時支持實時搶答、跨直播間PK、沖刺拉票等實時交互的創(chuàng)新場景。
·在線教育行業(yè)升級:通過實時音視頻服務(wù),教育行業(yè)將極大改善教學(xué)互動體驗,提升教學(xué)質(zhì)量。視頻高清在線,延遲無感知,清晰流暢;隨時互動教學(xué),小班課突破16人限制,大班課支持千人互動,自由連麥;還可以實時監(jiān)測學(xué)生學(xué)習(xí)情況,通過表情/姿態(tài)識別,實時自動提醒開小差的學(xué)生。
·辦公協(xié)同業(yè)務(wù)升級:基于實時音視頻,下一代云會議也在持續(xù)演進,在技術(shù)、體驗、業(yè)務(wù)形態(tài)等全面升級:極致音視頻通信,1080p高清晰度視頻通話,200毫秒超低時延,抗50%視頻丟包,抗80%音頻丟包,在弱網(wǎng)環(huán)境下也能順暢溝通;通過智能數(shù)據(jù)和文檔協(xié)作,4K超高清數(shù)據(jù)實時共享,無線投屏,白板共享,多人標(biāo)注,實時翻譯,自動紀(jì)要等,實現(xiàn)高效協(xié)作;突破技術(shù)限制,支持千人互動同時開會,多區(qū)域可同時參加;端云結(jié)合,全場景多屏互動,無論你在會議室、辦公室、在家里,還是在路上,隨時隨地都可接入會議,互動交流;更多的業(yè)務(wù)創(chuàng)新,直播+會議互動結(jié)合;跨企業(yè)、聯(lián)接客戶與伙伴的在線展會、在線營銷、在線培訓(xùn)……
VR/AR,正在打開未來新視界
VR、AR和自由視角等新視頻業(yè)務(wù)形態(tài)正在快速發(fā)展,給人們帶來更沉浸、更自由的虛實結(jié)合的全新交互體驗,行業(yè)創(chuàng)新大量涌現(xiàn)。
在社交媒體領(lǐng)域:虛擬主播正在成為互動直播和電商帶貨的新方向?;谔摂M的背景,虛擬空間,呈現(xiàn)了一個類真實的虛擬世界;通過虛擬人,或者真人仿真,以及姿態(tài)擬合,讓你同主播進行實時互動,帶來不一樣的虛實交互體驗。
在智慧教育領(lǐng)域:可以呈現(xiàn)3D虛擬影像,進行360°多視角立體觀摩,甚至引入沉浸式聲場,觸覺式反饋,來開展VR/AR互動教學(xué),給學(xué)生帶來真實的環(huán)境場景和感知交互,提升學(xué)習(xí)效果。
在工業(yè)互聯(lián)網(wǎng)領(lǐng)域:進行工業(yè)仿真設(shè)計,在同比例虛擬空間中,動態(tài)調(diào)整設(shè)計原型,進行生產(chǎn)模擬、工藝分析和虛擬試驗,縮短產(chǎn)品的研發(fā)周期,降低研發(fā)成本。
還有很多場景應(yīng)用,VR/AR游戲、VR/AR社交、VR/AR會議、VR/AR零售……正在加速向我們的生活和生產(chǎn)滲透。
VR/AR業(yè)務(wù),對算力、網(wǎng)絡(luò)資源的訴求呈指數(shù)級增長,將原生長在云上。從3D建模、渲染處理、空間定位、姿體跟蹤、數(shù)字孿生都承載在云上,以服務(wù)方式提供。
華為云致力于提供視頻基礎(chǔ)能力“黑土地”,使能千行百業(yè)創(chuàng)新
華為擁有業(yè)界最完整的端-管-云產(chǎn)業(yè)技術(shù),在音視頻領(lǐng)域持續(xù)耕耘30多年,擁有多達1186件音視頻算法專利,在編解碼算法、音視頻網(wǎng)絡(luò)傳輸、弱網(wǎng)對抗、媒體AI等領(lǐng)域積累了深厚的技術(shù)實力。
在視頻技術(shù)的演進發(fā)展過程中,華為云作為服務(wù)提供商,聚焦將基礎(chǔ)能力做到極致,降低技術(shù)門檻,為業(yè)界提供最優(yōu)質(zhì)的云視頻服務(wù),使能千行百業(yè)創(chuàng)新。