AIGC一路狂飆,在泛娛樂社交領(lǐng)域正掀起大片浪花。AI的引入,一方面促進(jìn)社交連接方式的變遷,從人與人的連接,延伸到人與虛擬人的連接,為社交玩法創(chuàng)造更多想象空間;另一方面AI可以進(jìn)一步增強(qiáng)社交黏度,作為一個(gè)強(qiáng)共情能力和無私的社交對(duì)象,提供社交中最重要的情緒價(jià)值,降低人際關(guān)系摩擦。
長久以來,聲網(wǎng)都在AI這一領(lǐng)域持續(xù)投入,比如AI降噪、AI回聲消除等能力就是基于聲網(wǎng)自研的AI推理引擎實(shí)現(xiàn)。近期,聲網(wǎng)也在結(jié)合社交玩法中的一些應(yīng)用去幫助開發(fā)者使用大模型實(shí)現(xiàn)場(chǎng)景的創(chuàng)新,比如基于特定場(chǎng)景下定制模型的訓(xùn)練與打磨,大模型的多模態(tài)特別是聲音模態(tài)的大模型探索。
GPT+X,新玩法的探索
AIGC(AI Generated Content人工智能生成內(nèi)容),也可以稱為生成式AI,例如AI文本續(xù)寫,文字轉(zhuǎn)圖像的AI圖、AI主持人等,都屬于AIGC的范疇。GPT(Generative Pre-Trained Transformer生成式預(yù)訓(xùn)練轉(zhuǎn)換器)是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓(xùn)練的、文本生成的深度學(xué)習(xí)模型,GPT是AIGC技術(shù)的一個(gè)種類。近期,數(shù)字化、企服、金融等行業(yè)都在探索與GPT的融合,泛娛樂社交產(chǎn)品融入GPT玩法也將是行業(yè)趨勢(shì)。比如虛擬主播,桌游以及社交產(chǎn)品中的一些代聊場(chǎng)景,都很適合與大語言模型結(jié)合。
今天我們來了解一下聲網(wǎng)在以上領(lǐng)域最新探索的成果,GPT與“誰是臥底”玩法的結(jié)合。
誰是臥底是一個(gè)經(jīng)典的多人社交推理類游戲,游戲開始時(shí)n(n≥3)個(gè)人拿到相同的一個(gè)詞語,剩下的人(臥底)拿到與之相關(guān)的另一個(gè)詞語。每人每輪只能說一句話描述自己拿到的詞語(但不能直接說出),既不能讓臥底發(fā)現(xiàn),也要給同伴以暗示。每輪描述完畢,n人投票選出懷疑是臥底的那個(gè)人,得票數(shù)最多的人出局,平票則進(jìn)入下一輪描述,若最后僅剩三人(包含臥底),則臥底獲勝。
因?yàn)閷?duì)參與人數(shù)有一定要求,且此類游戲人多才更有互動(dòng)氛圍?;诖送袋c(diǎn),聲網(wǎng)推出了GPT+誰是臥底的新玩法,由GPT來充當(dāng)其中一名玩家,在游戲中學(xué)習(xí)、提煉其他玩家的發(fā)言格式,對(duì)自己的關(guān)鍵詞進(jìn)行描述發(fā)言,并能通過分析其他玩家的發(fā)言,做出“誰是臥底”的判斷并進(jìn)行投票。
在游戲中,我們也遇到過AI當(dāng)臥底的局,測(cè)試下來AI的局內(nèi)表現(xiàn)亮眼,甚至有作為臥底獲勝的能力。
該模式的成功探索未來可以應(yīng)用到諸如狼人殺、劇本殺等更多游戲場(chǎng)景中?,F(xiàn)階段,社交行業(yè)對(duì)AIGC的應(yīng)用如火如荼,市面上也出現(xiàn)了各類“AIGC+社交“的玩法,例如,AI智能問答客服,可以對(duì)新手玩家進(jìn)行游戲玩法指引;AI陪聊,可以和玩家1對(duì)1聊天,起到傾聽、陪伴的作用;AI主持人,可以學(xué)習(xí)游戲等主題規(guī)則并引導(dǎo)玩家進(jìn)行游戲或聊天等。
在音視頻社交場(chǎng)景中,聲網(wǎng)也在積極探索AIGC+X的更多形式,賦予AI不同的角色適用于不同的玩法和場(chǎng)景中。比如在電商直播、秀場(chǎng)直播中,AI可作為問答助手幫助主播實(shí)時(shí)回復(fù)一些粉絲的提問;在社交應(yīng)用中,AI可以作為聊天助手,為真實(shí)用戶帶去更多的互動(dòng)和陪伴;而在游戲場(chǎng)景中,AI則能夠和真人玩家一起語聊互動(dòng)、參與游戲,帶來更為豐富的游戲體驗(yàn)。
4大技術(shù)優(yōu)勢(shì),帶來全新社交體驗(yàn)
1.聲網(wǎng)實(shí)時(shí)互動(dòng)能力與元宇宙、GPT玩法相結(jié)合
極低延時(shí):采用聲網(wǎng)實(shí)時(shí)互動(dòng)能力,信令延時(shí)低至30ms、端到端語音延時(shí)最小到65ms,帶來“面對(duì)面”擬真體驗(yàn),減少AIGC整體方案的延遲,讓AI“反應(yīng)”的更快
領(lǐng)先語音技術(shù):通過聲網(wǎng)AI回聲消除、降噪等技術(shù),即便在嘈雜的背景環(huán)境下,也能讓GPT“聽到”清晰的語音,并做出相應(yīng)回復(fù)
TTS、STT識(shí)別更準(zhǔn)確:即便在高達(dá)80%的丟包環(huán)境下,也能通過準(zhǔn)確的人聲識(shí)別和斷句,讓語音轉(zhuǎn)文字(STT)更準(zhǔn)確,文字轉(zhuǎn)語音(TTS)更清晰、流暢
目前很多開發(fā)者都在使用IM的方式讓玩家和AI角色互動(dòng),接入聲網(wǎng)RTC,花樣語音互動(dòng)方式讓玩法更有趣、更沉浸
2.場(chǎng)景化的專業(yè)訓(xùn)練能力
豐富的AI個(gè)性和風(fēng)格:聲網(wǎng)能夠滿足不同泛娛樂場(chǎng)景中用戶對(duì)于AI角色個(gè)性化風(fēng)格的需求
快速的模型訓(xùn)練:根據(jù)需求,聲網(wǎng)最快1周即可改進(jìn)、優(yōu)化不同的場(chǎng)景模型
專業(yè)化的場(chǎng)景建設(shè)能力:基于聲網(wǎng)多年在泛娛樂社交行業(yè)積累的經(jīng)驗(yàn),結(jié)合GPT算法專家知識(shí)能力,輸出更好玩的AI+音視頻社交場(chǎng)景玩法
3.擁有GPT大模型,STT、TTS等合作伙伴優(yōu)勢(shì)
聲網(wǎng)與國內(nèi)知名廠商合作,能夠提供相關(guān)能力且在方案中可以按需自由替換,避免企業(yè)自己對(duì)接踩坑,提高整體上線速度
在利用GPT大模型方面,聲網(wǎng)會(huì)根據(jù)客戶的場(chǎng)景選擇合適的大模型,根據(jù)不同的場(chǎng)景做特定的模型數(shù)據(jù)庫和prompt,同時(shí)結(jié)合聲網(wǎng)RTC的低延時(shí)特性,讓用戶交互延遲達(dá)到最優(yōu),模型輸出更符合真實(shí)場(chǎng)景
4.與豐富的元宇宙玩法相結(jié)合
聲網(wǎng)能夠提供寫實(shí)、卡通等各種模型語音驅(qū)動(dòng)的AI形象,讓AI玩家、助手不再單調(diào),真實(shí)玩家與AI共同娛樂。
目前AIGC版誰是臥底DEMO已開放體驗(yàn),其他好玩的AIGC+社交場(chǎng)景也在火速開發(fā)中,您可以點(diǎn)擊下方閱讀原文,與我們?nèi)〉寐?lián)系。