声网 SDK 已支持端上实时 AV1 编码 同码率下画质更清晰
2024-05-27 11:45:44爱云资讯2379
AV1 是一种新型的视频编码格式,设计初衷是为了提供一款免专利费,且具备更高效、更灵活视频压缩的编码器,以适应不断增长的在线视频需求,特别是在流媒体和实时音视频领域。目前声网 SDK 已接入 AV1,在实时音视频场景中,可实现同等码率下,视频编码效率大幅提升,视频画质更加清晰。
在实时音视频场景中,高清化的趋势越来越明显,用户对画质的要来越来越高,高清画质也能给平台带来更高的人气与用户观看时长。同时,面对复杂的网络环境下(尤其是出海市场),高清内容传输压力大,难免要牺牲画质来保证流畅度,上下行多路音视频流传输也会造成带宽成本居高不下。
对此在RTC中接入AV1已是大势所趋,在视频通话中,相同的视频质量下,AV1的编码效率优于目前市场广泛使用的H.265,更远远高于H.264,这也意味着,在音视频通话中,在面对带宽网络有限的弱网环境,AV1可以保证同样流畅度下,视频画质更清晰。
在流媒体等非实时的视频场景中,AV1的视频压缩率相比于H.264高出50%以上,但代价是AV1的复杂度相比H.264也提升了超过十倍。在实时视频这类复杂度受限的场景下,声网AV1在做到复杂度低于H.264 10%的前提下,依然实现了编码效率提升36%,甚至在屏幕共享文档流模式下,相比H.264,声网AV1的视频压缩率提升高达80%。在编码速度层面,声网AV1的编码速度也比H.265提升了70%。
在软件编码器中,编码速度提升70%,意味着编码中CPU的消耗降低70%,真正可以做到端上实时的AV1编码。同时声网RTC+AV1还具备多重优势:
在画质方面,声网接入的AV1基于RTC场景下全链路打通,支持硬编硬解,软编软解,在保证低延迟、高流畅度体验的前提下,可根据设备性能自适应调整编解码策略,有效提升画质。
在产品应用方面,声网AV1可应用于声网的全产品矩阵,包含音视频通话、极速直播、互动直播、拉流转推流、实时录制等产品,面向全行业支持。
声网AV1的性能优势可以总结为:编码速度快、性能消耗低、同码率下画质更清晰、同画质下视频压缩率更高。此外,相比于H.264、H.265,AV1属于开放式的视频编码标准,不管是国内业务还是出海业务,都能快速接入。
我们通过下方的对比图,更直观的展示声网AV1相比其他编码器在实时场景下,编码性能与时间上的提升。
图1:EncodingTime:编码速度,越往左速度越快;BD-RATE:编码压缩率,越往下压缩率越高
我们可以通过下方两张图片,对比同600kbps码率下声网AV1与H.264的画质(720p/60fps)。
图2:600kbps码率下声网AV1 画质
图3:600kbps码率下H.264 画质
在应用场景层面,以游戏直播与出海场景为例,在游戏直播场景,视频规格需要满足4k/60fps,用户体验需要做到高画质、高流畅、低延迟,这时可通过AV1编码降低下行分发码率到10 M以内,减少网络传输的负担,提高直播的稳定性和可靠性。
在出海的实时互动场景中,面对极低的带宽网络环境,画质会变差,通过AV1编码提升视频压缩率30%以上,同等码率下,显著提升视频画质。
伴随iPhone A17芯片开始支持AV1硬解,目前很多主流厂商都在最新的旗舰芯片中集成了AV1硬解码能力,可以预见未来几年AV1在移动端的部署量会大幅上升,声网也会持续保持对AV1的投入,以提升实时互动中的用户体验。
相关文章
- 声网入选AIGC应用全景图谱、AI大模型产业图谱
- 声网对话式 AI 引擎接入智谱GLM模型,支持获取智能体短期记忆
- 声网对话式AI引擎摘得微软开发者挑战赛“最具商业价值奖”
- 2025年值得关注的AIGC产品 声网对话式AI引擎上榜
- 声网携手商汤,共拓实时音视频AI应用新边界
- 商汤日日新上线声网云市场,与四十家企业开启合作
- 声网对话式AI引擎获AWE艾普兰奖
- DeepSeek-V3-0324上线,声网对话式AI引擎同步支持
- 声网对话式 AI 开发套件全面开源 开启人机交互新体验
- 声网对话式AI引擎:5大能力让你的Agent比ChatGPT更会说话
- 声网携手博通集成,RTE+AI赋能智能硬件创新
- 声网Conversational AI Agents获CSDN、大模型之家、赛迪网奖项
- 声网刘斌:RTE 演进助力 AI Agent 应用落地
- 声网 Conversational AI Agents 荣获 2024 人工智能年度杰出解决方案
- 助力开发者升级音视频体验,声网荣获HarmonyOS NEXT SDK星河奖
- 声网入选首届低空智联云领航者典型案例