AI show|点赞!云知声音频文件转写准确率提升超3%
2022-06-09 07:51:42爱云资讯
无论是会议、访谈录音的整理,还是各种视频的字幕制作与语音质检,快速解决各类场景下的音频转文字的需求,都离不开音频文件转写服务。
音频文件转写服务,是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用,将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。
近期,云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚,云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级,尤其声学模型方面,首次使用了基于注意力机制的端到端模型,在准确率方面有了明显提升;同时,在快速纠错和热词识别等方面也进行了功能优化与实时更新,进一步满足了各使用场景用户的需求,提升音频文件转写使用体验。
01全新技术升级准确率提升超3%
最新的版本中,云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统(Attention-based Encoder Decoder),又创新性的提出了SMAD(Self-and-Mixed attention Decoder)技术,即在解码中,采用文本和声学的混合注意力机制,从而得到识别的最优结果。
无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音,都可以实现准确转写。在通用场景测试中,云知声准确率绝对提升超3%。达到行业顶尖水平。这不仅能带给终端用户更好的体验;对开发者来说,也是一次效率以及质量的升级,大大满足开发者精0益求精的诉求。
02 更简单易用开发者0成本接入先进语音识别技术
音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口,具备流式传输能力和轻量、跨平台的特点,方便开发者直接调用、快速集成。
云知声作为国内头部的人工智能独角兽企业,以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。
本次升级只是技术提升,并不改动接口,所以原来对接过云知声音频文件转写服务的开发者没有任何影响。
此外, 我们为新接入的开发者准备了免费体验包,注册即可认领;实名认证的个人开发者和企业开发者,还可以获得一大份认证礼包。
新手 3步 集成:
作为新一代智能语音识别引擎,云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线,以优质的性能对外提供AI开放式服务,赋能更多对音频文件转写有需求的开发者与合作伙伴。
未来,团队会在继续打磨技术的基础上,赋能更多应用场景,加速语音识别技术的快速落地!
- 助推智慧医疗产业健康发展,云知声加入医学人工智能委员会
- 云知声蓝藻AI服务升级,持续释放内容创作生产力
- 山海启航,云知声迈向AGI新征程
- 以AI促就业,云知声智能语音求职机落地厦门枋湖社区
- 云知声董事长、CTO梁家恩:AGI赋能未来的力量
- 云知声携手合作伙伴,共创智慧车载人机交互新纪元
- 云知声受邀出席京西智谷大模型生态共建点亮仪式并获算法模型认证证书
- 云知声上市在即,企业通过通用人工智能(AGI)创建互联直觉的世界
- 云知声参与长三角商业创新样本发布会,展示创新实力,上市可期
- 云知声×睿蓝,智慧掌控每一次出行
- 云知声智慧车载赋能企业行业,让出行更智慧、便捷
- 玩转AI新“声”态,云知声情感合成音色上线
- AI Show丨让科技更适老,云知声智慧康养解决方案打造“老有所依”城市样本
- 云知声山海大模型成功发布,为各行业带来新增长范式
- 云知声揭示AI演进趋势:从算法中心到模型中心的转变
- 云知声与中建电子达成战略合作