Opus 1.6音频编解码器发布 新增机器学习功能

2025年12月17日 13:24 次阅读 稿源:Win10s.COM 条评论

开源音频编解码器 Opus 的核心库 libopus 迎来 1.6 版本更新,新版本在延续 1.5 版引入的机器学习特性基础上,进一步加入多项基于神经网络的语音增强能力,并带来高采样率支持和编码接口改进 。Opus 作为广泛应用于语音通话、在线会议与流媒体场景的开源标准,此次更新被开发者社区视为在音质增强与可用性上的一次重要升级 。

image-1.webp

Opus 1.6 的主要改动包括:新增宽带到全带宽的带宽扩展(BWE)模块,支持 96 kHz 采样率的 “Opus HD” 实验性模式,对 Deep Redundancy(DRED)机制进行了显著改进,引入全新的 24 位编码/解码 API,以及针对定点实现的一系列优化 。其中,DRED 旨在在网络抖动和丢包环境下提高音频恢复能力,新版本通过改进冗余编码策略,在复杂网络条件中有望提供更稳定的主观听感 。

此次新增的语音带宽扩展功能为实验性模块,基于神经网络模型,将 0–8 kHz 的宽带语音推断生成 8–20 kHz 的高频语音内容,从而在接收端重建接近全带宽的语音效果 。开发者在演示页面中指出,该模型无需额外的侧信息就能工作,可用于增强任何以往版本 Opus 编码生成的宽带语音流,因此在解码端部署时不会破坏现有协议兼容性 。模型背后的核心判断是,语音的音素信息已经基本包含在低频段中,高频主要是可被推断的音质细节;相比之下,从窄带(电话级)直接扩展到宽带在技术上更困难、可靠性更差,因此本次只针对宽带到全带宽场景进行增强 。

在具体应用方式上,该 BWE 模型可以选择性地将宽带语音解码为 48 kHz 采样的全带宽语音,并且可以与 Opus 1.5 中引入的宽带增强方法组合使用,以进一步提升整体听感 。不过,开发者也明确表示,这一模型并非用于替代混合模式下原生编码的高频内容,对超宽带或全带宽输入不会自动启用,以避免对本就高质量的原始数据进行过度“加工” 。由于其为解码端可选增强算法,后续模型改进也不会影响现有流媒体传输格式,从而为持续迭代留出了空间 。

除了机器学习相关增强外,Opus 1.6 还引入了对 96 kHz 音频的实验性支持,即所谓 “Opus HD”,这一特性主要面向对高解析度音频有需求的应用场景,被开发者视为值得关注的方向性尝试 。新提供的 24 位编码/解码 API 则为专业音频处理和高动态范围内容提供了更佳的技术基础,配合定点实现优化,有助于在嵌入式设备与资源受限平台上获得更高效的运行表现 。

更多关于 Opus 1.6 的技术细节与下载链接已在 Opus 官方网站公布,开发者和厂商可据此评估集成与升级方案 :

https://opus-codec.org/release/stable/2025/12/15/libopus-1_6.html

对文章打分

Opus 1.6音频编解码器发布 新增机器学习功能

1 (50%)
已有 条意见

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      Top 10

      招聘