騰訊的AI與產(chǎn)業(yè)互聯(lián)網(wǎng)已進入全新發(fā)展階段,優(yōu)圖實驗室的視覺智能在其中將發(fā)揮怎樣的作用?
「人工智能本身就是一場跨國跨學科的探索,正在將人類的認知推向更快更高更強,也勢必帶給我們一場前所未見的科技和產(chǎn)業(yè)革命,」在近日在上海舉行的世界人工智能大會WAIC 2020上,馬化騰對人工智能的未來發(fā)出了這樣的預測。
今天,AI技術(shù)正變得無所不在,新基建和產(chǎn)業(yè)互聯(lián)網(wǎng)將為各行各業(yè)的發(fā)展帶來新增量。面對新的發(fā)展機遇,騰訊提出了全新的戰(zhàn)略,而騰訊優(yōu)圖實驗室在其中正扮演著重要角色。
「我們可以看到,視覺AI相關(guān)應用業(yè)務正在飛速增長,這反映了企業(yè)端的人工智能技術(shù)需求正在釋放,」騰訊優(yōu)圖實驗室副總經(jīng)理黃飛躍表示。
四大AI平臺齊亮相
在7月10日的WAIC大會上,騰訊提出的「雙引擎+雙輪」驅(qū)動人工智能發(fā)展新形式再次引來人們的關(guān)注。與此同時,騰訊優(yōu)圖一口氣發(fā)布了應用視覺AI能力的四大平臺:AI泛娛樂平臺、廣電傳媒AI中臺、內(nèi)容審核平臺和工業(yè)AI平臺,成為了大會的亮點。
在WAIC 2020上,騰訊優(yōu)圖實驗室總經(jīng)理吳運聲進行了「新基建新生態(tài)下的計算機視覺」的主題演講。
首先是泛娛樂平臺,依托騰訊在社交娛樂產(chǎn)品上的豐富實踐,優(yōu)圖在人臉融合、人像分割、人像變化、美顏美妝等方面積累了豐富的泛娛樂基礎(chǔ)能力,打造了泛娛樂全棧工具箱,其中包括AI互動體驗展解決方案、AI創(chuàng)意營銷解決方案、美顏特效SDK三大解決方案。
在廣電傳媒行業(yè),通過引入AI技術(shù),騰訊可以將視頻處理效率提升至1:1(花費1小時處理剪輯1小時長度的視頻),實現(xiàn)符合標準的結(jié)果輸出。在智能審核場景中,AI能幫助媒體內(nèi)容管控效率提升并降低漏檢率。
廣電媒體AI中臺支持多維度的視頻理解和智能處理,為視頻運營側(cè)提供結(jié)構(gòu)化的數(shù)據(jù)結(jié)果,建立了多模態(tài)搜索的基礎(chǔ),提升了素材再利用效率(如幫助視頻再生產(chǎn),打造內(nèi)容專欄)。另外,能夠通過視頻理解結(jié)果進行內(nèi)容運營,打造千人千面的媒體應用。
騰訊優(yōu)圖內(nèi)容審核平臺可提供審核一站式服務。在常規(guī)審核系統(tǒng)基礎(chǔ)能力之上還包含ACG場景識別、兒童色情識別、低俗場景識別等功能。在識別效果上,鑒黃、監(jiān)控、鑒證的準召率超過99%。客戶接入后,三天即可完成定制化模型訓練,兩小時內(nèi)完成客戶定向策略運營。這一技術(shù)可以更好地滿足用戶的實時定制需求,目前已在電商、文創(chuàng)、廣電等行業(yè)解決方案中廣泛應用。
面向傳統(tǒng)行業(yè)的工業(yè)AI平臺則可以快速滿足工業(yè)領(lǐng)域的缺陷檢測、備件拍照識別、工廠工效優(yōu)化等客戶需求。并提供數(shù)據(jù)管理、在線訓練、效果評估、業(yè)務編排等全過程個性化訓練服務,滿足上述場景的差異化需求。平臺支持私有化及公有云部署,提供業(yè)界領(lǐng)先的加速、調(diào)度與容器服務,以更少的硬件資源支持更復雜的業(yè)務。
騰訊表示,這些平臺具備靈活權(quán)限及可拓展能力,合作伙伴可直接使用平臺進行工業(yè)AI項目交付,還可基于平臺進行上層業(yè)務開發(fā),實現(xiàn)AI技術(shù)與行業(yè)能力的能力互補,合作共建各領(lǐng)域的工業(yè)AI解決方案。
八年如一日,聚焦視覺AI
在人工智能領(lǐng)域里,感知智能的發(fā)展速度更快。根據(jù)清華大學的數(shù)據(jù)顯示,計算機視覺、語音技術(shù)及自然語言處理技術(shù)的市場規(guī)模占比分別為34.9%、24.8%和21%,視覺幾乎是落地最順利、商業(yè)化程度最高的領(lǐng)域,這也是騰訊優(yōu)圖一直以來的主要研究方向。
「在騰訊930業(yè)務組織調(diào)整之后,云與智慧產(chǎn)業(yè)事業(yè)群CSIG成為騰訊to B的戰(zhàn)略窗口,而優(yōu)圖是CSIG的主要實驗室。對于優(yōu)圖來說,我們的定位已更加清晰——專注于視覺AI的技術(shù)研發(fā),」黃飛躍告訴我們。
2008年,從清華博士畢業(yè)的黃飛躍加入當時的騰訊研究院,帶領(lǐng)5人小組投身開發(fā)一款名為「QQ影像」的桌面處理軟件,他們是國內(nèi)大規(guī)模應用計算機視覺先進技術(shù)的最早一批從業(yè)者。今天這個團隊已經(jīng)發(fā)展成為幾百人規(guī)模,算法人員比例超過60%的大型研究機構(gòu),成為了騰訊旗下,乃至計算機視覺領(lǐng)域鼎鼎有名的優(yōu)圖實驗室。
優(yōu)圖從2012年成立至今,在技術(shù)從探索到落地的過程中,核心思路一直在發(fā)生轉(zhuǎn)變?!冈趦?yōu)圖團隊剛剛成立時,我們主要想的是怎樣把技術(shù)本身做好,」黃飛躍說道?!肝覀兓ㄙM大量時間深入理解了技術(shù)產(chǎn)生價值的方式,只有如此,才能夠把技術(shù)價值放大到最大?!?/span>
優(yōu)圖團隊最初的任務是把其開發(fā)的壓縮算法應用到QQ空間里。在這里,技術(shù)產(chǎn)生了一定的價值,但主要是業(yè)務成本降低和體驗優(yōu)化,仍沒有帶來最直接的用戶體驗提升。
在2015年,優(yōu)圖把視覺AI技術(shù)應用到微眾銀行的遠程開戶,實現(xiàn)了業(yè)務的對外輸出。很快,優(yōu)圖實驗室與騰訊云開始了整合,技術(shù)落地走上了快速軌道。
迄今為止,優(yōu)圖已打造了超過15種行業(yè)解決方案,為騰訊公司內(nèi)部如QQ、QQ空間、微信、微視、騰訊云等超過90余個產(chǎn)品業(yè)務提供計算機視覺AI算法支持,并聯(lián)合騰訊云、微信等騰訊內(nèi)外部合作伙伴,向工業(yè)、教育、交通、文旅等領(lǐng)域共同輸出行業(yè)解決方案。
騰訊優(yōu)圖在發(fā)展新技術(shù)時,一直以技術(shù)的應用價值為導向?!肝覀冊谶M行新技術(shù)研發(fā)時都會思考這個維度,這意味著它們必然是有業(yè)務基礎(chǔ)的。這也是和團隊基因有關(guān)系,初始團隊成員很多都具有相關(guān)的業(yè)務背景。」黃飛躍介紹道。
在業(yè)務落地后,優(yōu)圖會持續(xù)關(guān)注技術(shù)的實際價值和用戶體驗,根據(jù)反饋需求和發(fā)現(xiàn)的問題,不斷迭代優(yōu)化技術(shù)成果。隨著工具不斷升級,技術(shù)會越來越好,適用場景越來越多,更多用戶也會為此買單,實現(xiàn)良性循環(huán)的正反饋過程。
在探索方向上,騰訊優(yōu)圖團隊的技術(shù)研發(fā)非常聚焦——不傾向于發(fā)散放大技術(shù),而是不斷積累技術(shù),將一些方向做深做透。優(yōu)圖傾向于在成功技術(shù)的基礎(chǔ)上不斷拓展范圍,從而保證自己在一定方向上保持最好。
目前,優(yōu)圖旗下最熱門的技術(shù)之一人臉核身,支持了北京、上海等全國多地的健康碼,以及一些銀行大額轉(zhuǎn)賬的過程中的核身過程,這項技術(shù)在市場占有率上保持了絕對領(lǐng)先。
優(yōu)圖核身技術(shù)的領(lǐng)先,正是不斷迭代優(yōu)化的結(jié)果。「我們自2014年就開始了身份識別技術(shù)的研發(fā),從微眾銀行、騰訊云慧眼,再到微信小程序。我們接觸到了大量客戶和場景,在這個過程中不斷提升了技術(shù)能力?!裹S飛躍表示。
核身技術(shù)中,除了識別人臉之外,活體檢測是重中之重:黑產(chǎn)會不斷嘗試在各個方面進行攻擊。據(jù)介紹,從2014年至今,優(yōu)圖已經(jīng)迭代了5個不同的解決方案,從最開始的動作唇語,到交互檢測,到騰訊獨創(chuàng)的光線核體方案,再到現(xiàn)在更加先進的解決方案,通過海量用戶觸達,不斷更新的技術(shù),優(yōu)圖把身份檢測這件事做到了極致。
目前優(yōu)圖人臉核身技術(shù)的流程。
「今年優(yōu)圖上線的全新人臉安全技術(shù)對于物理攻擊、模型合成攻擊、深度學習對抗樣本都有很強的防御能力。我們的多模態(tài)活體檢測技術(shù)已經(jīng)通過了國家銀行卡檢測中心BCTC的人臉識別技術(shù)檢測,達到了金融支付級安全標準。」黃飛躍說道。
不僅如此,優(yōu)圖也在不斷探索前沿技術(shù)。優(yōu)圖公開發(fā)表的論文涵蓋ICCV,CVPR,AAAI等各類頂級會議,僅2020年即被國際計算機視覺頂級會議CVPR接收了17篇論文。此外,優(yōu)圖與中科院軟件所、中科院自動化所、上海交通大學、廈門大學、密西根州立大學、中山大學等國內(nèi)外高校開展高校合作項目,在人臉人體基礎(chǔ)技術(shù)、神經(jīng)網(wǎng)絡模型壓縮、視覺內(nèi)容檢索、智能硬件平臺、視頻內(nèi)容分析等研究方向上進行合作研究。
轉(zhuǎn)向B端,成為新生產(chǎn)力
2017年,騰訊正式提出AI in All戰(zhàn)略,并逐漸搭建了以人工智能實驗室、前沿科技實驗室為雙引擎,消費互聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng)為雙輪的AI戰(zhàn)略布局。在930組織結(jié)構(gòu)變革之后,優(yōu)圖成為了騰訊云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)旗下的成員,該事業(yè)群成為騰訊To B的戰(zhàn)略窗口,是騰訊20余年歷史上首次出現(xiàn)完全面向企業(yè)客戶的大業(yè)務單元。
目前,騰訊為工業(yè)制造、醫(yī)療、政務、文旅、金融等行業(yè)提供了90余種互聯(lián)網(wǎng)解決方案,其中80%應用到了人工智能技術(shù)。
黃飛躍認為,產(chǎn)業(yè)互聯(lián)網(wǎng)最終的目的還是服務好C端用戶:「C to B是騰訊產(chǎn)業(yè)互聯(lián)網(wǎng)的優(yōu)勢,騰訊擁有超過10億用戶,也有長期積累的洞察和經(jīng)驗。我們會把對于C端的服務經(jīng)驗輸出給合作伙伴,幫助企業(yè)更好地觸達用戶?!?/span>
從面向消費者轉(zhuǎn)為面向企業(yè),是否會影響未來技術(shù)創(chuàng)新的思路?其實在優(yōu)圖內(nèi)部,人們對此也有疑問。「在轉(zhuǎn)型的過程中,我們有很多人都在思考這個問題,研究團隊承擔的角色不僅是業(yè)務落地的支持——這對于優(yōu)圖來說缺少持續(xù)發(fā)展的動力,」黃飛躍說道?!肝覀儾粌H要支持業(yè)務發(fā)展,另一方面也要不斷探索,尋找業(yè)界、學術(shù)界的技術(shù)趨勢,能夠產(chǎn)生更大價值的技術(shù)。我們會花費更多精力進行研發(fā)。」
在WAIC大會上,騰訊公司副總裁、騰訊研究院院長司曉正式發(fā)布了《騰訊人工智能白皮書:泛在智能》,作為騰訊第一份全面介紹AI、闡述騰訊AI布局和思考的白皮書,該書從宏觀環(huán)境、技術(shù)研究、落地應用、創(chuàng)新經(jīng)濟、制度保障五個維度,描繪了泛在智能的全景。計算機視覺是白皮書的重要內(nèi)容:隨著5G等技術(shù)的發(fā)展,工業(yè)視覺正在成為新的生產(chǎn)力,而人們對于視頻內(nèi)容的需求將催生更為廣泛的市場。
騰訊在白皮書中指出,疫情之后的近未來將是全球經(jīng)濟重建的重要時期,也是社會轉(zhuǎn)型的重要時期。這為人工智能的發(fā)展打開了新的窗口期,并將提供豐富的實踐場,一個「泛在智能」的世界正在加速成為現(xiàn)實。
5月26日,騰訊宣布未來五年將投入5000億,用于新基建項目的進一步布局,人工智能是重點投入的領(lǐng)域?,F(xiàn)在,騰訊希望讓人工智能發(fā)揮產(chǎn)業(yè)互聯(lián)網(wǎng)「中央處理器」的作用。