讯飞智作首发超拟人数字人,一张照片可快速创建你的专属数字人
2024-11-06 20:42:36AI云资讯19198
在降低数字人定制门槛的道路上,讯飞智作按下了加速键。2024 年 10 月 24 日,讯飞智作首发超拟人数字人,仅需一张照片就能实现数字人定制。此次超拟人数字人嵌入至讯飞智作小程序上,无需打开电脑登录,在人人拥有手机的年代,再次降低用户路径,让每人拥有自己的超拟人数字人成为可能。

作为科大讯飞旗下一款 AIGC 内容生产平台,讯飞智作自诞生以来就一直为用户提供「AI 配音」「数字人视频播报」「声音定制」「形象定制」等服务,致力于提高各种场景下音视频内容生产效率。而此次首发超拟人数字人,更是讯飞智作在 AI 领域的进一步跃升。

基于大模型的多模态交互技术的创新与升级,讯飞智作首发超拟人数字人让个性化数字人的打造有了更多选择。数字人定制不再是调用提前录制模版资源的「预制菜」,而是由一张照片就能驱动的新突破。
在此次技术提升下,一张照片驱动数字人不仅没有让超拟人数字人表现力降低,反而借助情感贯穿的多模态交互能力,提升其表情与肢体的表现能力。大模型的多模态交互技术统一了文本、语音和表情,实现跨模态的语义一致性。也就是说,超拟人数字人的情感表达更加真实连贯,数字人的口唇不仅能够高度同步,表情和动作上也会随之变化表现,更贴近真人的情感表达。

于此同时,超拟人数字人还与此前的「一句话声音复刻」功能做了有机结合。借助大模型语音合成技术,用户在定制专属的超拟人数字人声音时仅需根据提示朗读文本,讯飞智作便会快速学习你的音色、韵律以及说话习惯,短短几秒钟便能复刻出其高质量的专属音频。不仅如此,讯飞智作还实现了跨语种复刻的能力。

讯飞智作小程序「声音复刻」功能页面
在当下大模型竞争的白热化阶段,讯飞智作选择将视角转向注重真实场景落地的技术优化。超拟人数字人这一技术的实现,让数字人普及 N 种场景成为可能,成为促进千行百业智能化转型的重要动力。
在传统的教培场景下,数字人定制多服务于教师职能。如大学老师借助数字人定制服务让每个人都拥有自己的云课堂,定制 2D 高仿真的虚拟数字人再通过合成课件 PPT、素材、场景、视频完善课程教学。而此次超拟人数字人进一步提升教师应用场景的便捷性,无需录制长段的绿幕视频,仅需一张照片,讯飞智作便可自动生成属于教师的超拟人数字人。除了大学教师,在中小学教育场景下,利用超拟人数字人来进行赛课无疑也是一种高效且吸引的手段。
在自媒体场景下,超拟人数字人的应用前景尤为广阔。通过一张照片即可生成超拟人数字人,让口播博主不再困顿于视频场景的繁琐布置、口播录制反复修改等问题。仅需一张优质的照片,输入想要表达的文案,即可生成优质的出镜视频。

讯飞智作小程序超拟人数字人定制页面
讯飞智作首发超拟人数字人作为一种全新的数字人定制通路,不仅升级新增了多模态、超拟人、个性化等特性,还全方位丰富了数字人的「交互」。仅需一张照片生成的超拟人数字人为各行各业带来了前所未有的创新和变革,相信未来能为企业和用户提供更加优质和便捷的服务。

讯飞智作小程序超拟人数字人部分公版形象
当下,讯飞智作小程序上在首发超拟人数字人后也在不断优化,持续增加更多公版形象。期待讯飞智作继续推出更多针对不同行业和领域的数字人技术,引领 AIGC 内容革命。
相关文章
- 未来智能发布viaim讯飞智能体耳机:迈出“AI Agent”战略第一步
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 讯飞星火党政智盒发布,打造国内首个安全可控、敢用易用的党政“龙虾”
- 科大讯飞发布玲珑Agent OS,让AI真正走进企业核心业务流
- 全球首发|讯飞Astron开源项目矩阵,构建企业级智能体完整技术生态
- 2026中国翻译协会年会召开,科大讯飞携多语言AI翻译产品矩阵亮相并获评5A级企业认证
- 科大讯飞佛山人工智能产业基地正式启用,助力南海构建AI产业生态
- 科大讯飞重磅布局智能穿戴,讯飞AI眼镜开启跨语言沟通新时代
- 科大讯飞AstronClaw升级,引领AI Agent从对话走向执行
- 科大讯飞亮相2026联合国中文日,让语言无界,让文化共鸣
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
- 科大讯飞AIPC华东制造基地正式投产,软硬智造一体出场即“数字员工”
- 科大讯飞与苏移集成签署战略合作协议,共推具身智能产业升级
- 从硬件集成到软核共研,科大讯飞与北京人形机器人创新中心深化合作
- 中关村国际技术交易中心揭牌 讯飞 AI 眼镜亮相
- 科大讯飞与金光集团签约战略合作,携手推动印尼人工智能转型
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









