日韩av无码专区不卡,91精品无码人妻系列

我國自主 AVS3 實時語音標(biāo)準(zhǔn)制定取得重要進展，騰訊方案入選

2023-12-15 09:49 IT之家

關(guān)鍵詞：實時語音

導(dǎo)讀：據(jù)新一代人工智能聯(lián)盟官方消息，近日，AVS3P10 實時語音編碼標(biāo)準(zhǔn)獲得重要進展。

　　據(jù)新一代人工智能聯(lián)盟官方消息，近日，AVS3P10 實時語音編碼標(biāo)準(zhǔn)獲得重要進展。

　　2023 年 12 月 14 日，第 87 次 AVS 工作組會議于成都開幕。會上，《智能媒體編碼第 10 部分實時語音》（以下簡稱 AVS3P10） WD 1.0 通過全體會議審議；騰訊提交的技術(shù)方案，被選擇為 AVS3P10 實時語音編碼的 RM0 基線。

　　實時語音通信技術(shù)，已廣泛應(yīng)用于協(xié)同辦公、互動娛樂、社交等領(lǐng)域。上述多樣豐富的應(yīng)用場景給實時語音通信技術(shù)提出了多種技術(shù)挑戰(zhàn)，其中，高質(zhì)量、低延時、低帶寬、高抗性的語音編碼是非常重要的一環(huán)。

　　傳統(tǒng)的語音編碼器，包括 AVS、ITU-T 等標(biāo)準(zhǔn)語音編碼器，在 16-20kbps 左右碼率時，能夠恢復(fù)出高質(zhì)量寬帶語音；在 30-35kbps，可以恢復(fù)出高質(zhì)量超寬帶甚至全帶語音。然而，當(dāng)碼率進一步降低（如：降到 10kbps 以下時），傳統(tǒng)語音編碼器恢復(fù)的質(zhì)量下降明顯，影響用戶體驗。

　　基于上述應(yīng)用訴求，在今年 3 月第 84 次 AVS 會議上，由騰訊提議在 AVS 音頻組啟動面向?qū)崟r語音通信場景的低碼率高質(zhì)量語音統(tǒng)項目。經(jīng)過需求分析，在第 85 次 AVS 會議上，AVS 正式立項 AV3P10 實時語音編碼項目，并通過 AVS 音頻組發(fā)出技術(shù)征集書。AVS3P10 實時語音編碼項目將由來自騰訊會議天籟實驗室的肖瑋負(fù)責(zé)推進和維護。

　　在第 86 次 AVS 會議上，音頻組審議了由騰訊會議天籟實驗室提交的 M7886《AVS3P10 語音編碼參考模型候選技術(shù)方案》提案。

　　審議指出該方案具有以下 4 點特征：

　　深度融合了經(jīng)典信號處理和深度神經(jīng)網(wǎng)絡(luò)技術(shù)等人工智能技術(shù)，屬于 AI Codec；

　　支持低碼率、高質(zhì)量編碼、實時編碼和解碼和多速率編碼；

　　基于子帶編碼和多模式編碼架構(gòu)，低頻信號采用深度神經(jīng)網(wǎng)絡(luò)提取特征，高頻信號采用頻帶擴展方案提取特征，結(jié)合標(biāo)量量化和熵編碼完成特征壓縮；

　　具有開放的編碼神經(jīng)網(wǎng)絡(luò)架構(gòu)技術(shù)特征，在保證碼流前向兼容基礎(chǔ)上，可以重新修改和優(yōu)化編碼神經(jīng)網(wǎng)絡(luò)。

　　今年 11 月 1 日，騰訊會議天籟實驗室提交 AVS3P10 RM0 候選方案的可執(zhí)行文件，由中國電子技術(shù)標(biāo)準(zhǔn)化研究院和華為分別進行了主觀測試和交叉驗證。交叉驗證力求全面，基于 ITU-T P.800 DCR 主觀質(zhì)量評價體系，主觀測試覆蓋不同帶寬下純凈語音、丟包語音、混合語音等多場景，并首次將 3A 處理后的測試場景引入信源編碼器測試中，以檢驗新一代 AI Codec 技術(shù)在貼近真實場景的表現(xiàn)。

　　在上述測試場景下，AVS3P10 RM0 質(zhì)量優(yōu)勢明顯。主觀測試結(jié)果表明，AVS3P10 RM0 在寬帶和超寬帶等多個主要測試場景均達到了 4.0 以上 MOS 分，體現(xiàn)出明顯優(yōu)勢，最低碼率可達 5.9kbps。AVS3P10 RM0 采納了深度神經(jīng)網(wǎng)絡(luò)技術(shù)，自帶的丟包損傷能力，有效提升了編碼器在網(wǎng)絡(luò)不佳時的質(zhì)量。

　　此外，在 ITU-T P.863 客觀質(zhì)量評價實驗中，AVS3P10 RM0 也體現(xiàn)出了顯著優(yōu)勢。第一，在所有 8 個測試碼率中，AVS3P10 RM0 均超過 4.0MOS，最高在 4.45MOS。AVS3P10 RM0 的質(zhì)量，可以對齊 OPUS 和 EVS 等傳統(tǒng)信號處理編碼器在中高碼率的表現(xiàn)，達到運營級質(zhì)量。在 AI Codec 領(lǐng)域，AVS3P10 RM0 在相近碼率下，質(zhì)量優(yōu)勢在 0.6MOS 以上。上述測試結(jié)論均反映出，AVS3P10 RM0 代表了目前 AI Codec 的最高水平。

　　新一代人工智能聯(lián)盟表示，AVS3P10 實時語音編碼，作為新一代的語音編解碼技術(shù)標(biāo)準(zhǔn)，是對 AVS 系列標(biāo)準(zhǔn)的重要補充。

　　未來，AVS3P10 實時語音編碼項目，將按照既定計劃推進，預(yù)計在 2024 年中完成標(biāo)準(zhǔn)化工作。

我國自主 AVS3 實時語音標(biāo)準(zhǔn)制定取得重要進展，騰訊方案入選

相關(guān)閱讀

我國自主 AVS3 實時語音標(biāo)準(zhǔn)制定取得重要進展，騰訊方案入選