讯飞智作首发超拟人数字人,一张照片可快速创建你的专属数字人
2024-11-06 20:42:36AI云资讯19055
在降低数字人定制门槛的道路上,讯飞智作按下了加速键。2024 年 10 月 24 日,讯飞智作首发超拟人数字人,仅需一张照片就能实现数字人定制。此次超拟人数字人嵌入至讯飞智作小程序上,无需打开电脑登录,在人人拥有手机的年代,再次降低用户路径,让每人拥有自己的超拟人数字人成为可能。
作为科大讯飞旗下一款 AIGC 内容生产平台,讯飞智作自诞生以来就一直为用户提供「AI 配音」「数字人视频播报」「声音定制」「形象定制」等服务,致力于提高各种场景下音视频内容生产效率。而此次首发超拟人数字人,更是讯飞智作在 AI 领域的进一步跃升。
基于大模型的多模态交互技术的创新与升级,讯飞智作首发超拟人数字人让个性化数字人的打造有了更多选择。数字人定制不再是调用提前录制模版资源的「预制菜」,而是由一张照片就能驱动的新突破。
在此次技术提升下,一张照片驱动数字人不仅没有让超拟人数字人表现力降低,反而借助情感贯穿的多模态交互能力,提升其表情与肢体的表现能力。大模型的多模态交互技术统一了文本、语音和表情,实现跨模态的语义一致性。也就是说,超拟人数字人的情感表达更加真实连贯,数字人的口唇不仅能够高度同步,表情和动作上也会随之变化表现,更贴近真人的情感表达。
于此同时,超拟人数字人还与此前的「一句话声音复刻」功能做了有机结合。借助大模型语音合成技术,用户在定制专属的超拟人数字人声音时仅需根据提示朗读文本,讯飞智作便会快速学习你的音色、韵律以及说话习惯,短短几秒钟便能复刻出其高质量的专属音频。不仅如此,讯飞智作还实现了跨语种复刻的能力。
讯飞智作小程序「声音复刻」功能页面
在当下大模型竞争的白热化阶段,讯飞智作选择将视角转向注重真实场景落地的技术优化。超拟人数字人这一技术的实现,让数字人普及 N 种场景成为可能,成为促进千行百业智能化转型的重要动力。
在传统的教培场景下,数字人定制多服务于教师职能。如大学老师借助数字人定制服务让每个人都拥有自己的云课堂,定制 2D 高仿真的虚拟数字人再通过合成课件 PPT、素材、场景、视频完善课程教学。而此次超拟人数字人进一步提升教师应用场景的便捷性,无需录制长段的绿幕视频,仅需一张照片,讯飞智作便可自动生成属于教师的超拟人数字人。除了大学教师,在中小学教育场景下,利用超拟人数字人来进行赛课无疑也是一种高效且吸引的手段。
在自媒体场景下,超拟人数字人的应用前景尤为广阔。通过一张照片即可生成超拟人数字人,让口播博主不再困顿于视频场景的繁琐布置、口播录制反复修改等问题。仅需一张优质的照片,输入想要表达的文案,即可生成优质的出镜视频。
讯飞智作小程序超拟人数字人定制页面
讯飞智作首发超拟人数字人作为一种全新的数字人定制通路,不仅升级新增了多模态、超拟人、个性化等特性,还全方位丰富了数字人的「交互」。仅需一张照片生成的超拟人数字人为各行各业带来了前所未有的创新和变革,相信未来能为企业和用户提供更加优质和便捷的服务。
讯飞智作小程序超拟人数字人部分公版形象
当下,讯飞智作小程序上在首发超拟人数字人后也在不断优化,持续增加更多公版形象。期待讯飞智作继续推出更多针对不同行业和领域的数字人技术,引领 AIGC 内容革命。
相关文章
- 科大讯飞发布“懂你的AI黑板”——与AI同窗,让师生共鸣
- 更懂教育的AI:科大讯飞AI黑板再进化
- 科大讯飞全球新品发布会:以AI本地化部署助力中东政企数字化转型
- 星火万象,智创AI+生态|科大讯飞亮相2025中国移动全球合作伙伴大会
- 讯飞发布AI翻译耳机:准确、快速、自然,让全球沟通无限
- 科大讯飞同传大模型再升级,上海、迪拜同发讯飞AI翻译耳机
- IDC发布中国AI翻译技术评估报告:科大讯飞8项评测全部第一,6项满分领跑行业
- 科大讯飞联合团队成果登上核聚变领域顶刊《Nuclear Fusion》
- 输入法报告解读 讯飞输入法技术驱动成效显著
- 讯飞星火的秋招“新剧本”:呼兰+小鱼新招空降高校
- 科大讯飞“录焕星生”录音笔用户沙龙在京举办,共话智能录音新体验
- 全国医保影像云平台建设与应用技术交流会召开,讯飞医疗分享医保影像云“安徽模式”
- 讯飞听见 “组一组” 全新功能,开启电脑端团队协作转写新体验
- 2025世界制造业大会|科大讯飞用十项“黑科技”破解制造强国密码,发布羚羊工业大模型3.0
- 从东博会走向世界:讯飞听见多语言会议系统,以AI赋能出海企业全球化
- 科大讯飞联合华为发布“星火教育、医疗大模型场景一体机解决方案”









