微軟Azure智能語(yǔ)音合成全面升級(jí)到48kHz高保真模型

來(lái)源：IT之家

作者：瀟公子

時(shí)間：2022-11-18

微軟Azure神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語(yǔ)音服務(wù)（又稱“Neural TTS”，“智能語(yǔ)音合成”）能幫助用戶將文本轉(zhuǎn)換為逼真的人工智能聲音，它適用于多種應(yīng)用場(chǎng)景，包括智能語(yǔ)音助手、客服對(duì)話機(jī)器人、有聲內(nèi)容朗讀、游戲角色語(yǔ)音等。

IT之家 11月17日消息，微軟Azure神經(jīng)網(wǎng)絡(luò)文本轉(zhuǎn)語(yǔ)音服務(wù)（又稱“Neural TTS”，“智能語(yǔ)音合成”）能幫助用戶將文本轉(zhuǎn)換為逼真的人工智能聲音，它適用于多種應(yīng)用場(chǎng)景，包括智能語(yǔ)音助手、客服對(duì)話機(jī)器人、有聲內(nèi)容朗讀、游戲角色語(yǔ)音等。在過(guò)去的幾個(gè)月中，微軟Azure智能語(yǔ)音合成技術(shù)在語(yǔ)音自然度、聲音豐富度和多語(yǔ)言支持等方面取得了快速進(jìn)展。

今天微軟官方為大家?guī)?lái)了最新的神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成聲碼器HiFiNet2。

7c4aed02-14c4-42d7-a20d-475b3849edd6.webp.jpg

聲碼器是TTS中的關(guān)鍵組件之一，它基于輸入的文本或聲學(xué)特征來(lái)合成音頻樣本。目前，通過(guò)HiFiNet2聲碼器技術(shù)，微軟已經(jīng)將微軟Azure智能語(yǔ)音合成產(chǎn)品全面升級(jí)到48kHz聲音模型，進(jìn)一步為用戶帶來(lái)更高保真、高效率和可擴(kuò)展的AI語(yǔ)音音質(zhì)體驗(yàn)。這項(xiàng)更新包括400多個(gè)音色，覆蓋全球超過(guò)140個(gè)國(guó)家和地區(qū)的語(yǔ)言。

48kHz語(yǔ)音模型

在文本轉(zhuǎn)語(yǔ)音技術(shù)中，音頻的保真度是用來(lái)衡量音質(zhì)的一項(xiàng)重要標(biāo)準(zhǔn)。高保真聲音不但可以給用戶傳達(dá)更豐富、更細(xì)膩的音質(zhì)，同時(shí)還可以將音色的失真和變形降至最低。隨著采樣率的提升，聽(tīng)眾可以聽(tīng)到更精準(zhǔn)的細(xì)節(jié)和更真實(shí)的音色。在視頻配音、游戲和唱歌等需要更精細(xì)、更沉浸的聲音體驗(yàn)的復(fù)雜場(chǎng)景中，更高保真度的輸出（如48kHz采樣率）將給用戶帶去前所未有的全新感官體驗(yàn)。

現(xiàn)在，隨著Azure深度神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成服務(wù)將全平臺(tái)AI聲音升級(jí)到48kHz采樣率，微軟率先在業(yè)界為AI聲音用戶帶來(lái)真正高保真度的聲音體驗(yàn)。

d5e14d14-56ee-4df8-9fd9-387cb1442b48.webp.jpg

Azure 微軟云

上一篇：谷歌Google Maps將于下周推出AR地圖功能Live View

原文鏈接：點(diǎn)擊前往 >

版權(quán)說(shuō)明：本文內(nèi)容來(lái)自于IT之家，本站不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn)，不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán)，請(qǐng)聯(lián)系管理員（zzx@kchuhai.com）刪除！

相關(guān)文章