讯飞星火大模型赋能,开启虚拟人“全新意识”
2024-05-21 10:08:17AI云资讯5559
5月14日结束的OpenAI发布会推出其最新旗舰模型GPT-4o,展现了AI技术愈发强大的能力。在人工智能飞速发展、大模型不断涌现的今天,适逢讯飞星火大模型发布1周年。这一年里,讯飞星火给虚拟人带来很多惊喜与变革。

(图片由讯飞星火生成)
虚拟人本质上是对人的一种数字化模拟,具备三大特征:外观、行为、思想。这些特性的实现依赖一系列先进技术的融合,如图像识别、3D建模、动作捕捉、自然语言处理、计算机视觉等。目前讯飞星火大模型对虚拟人的赋能,体现在如下方面。
①形象定制更轻量:秒级构建
依托星火大模型,讯飞智作上线“秒级声音/形象构建”功能,可以实现声音和形象的快速制作!

讯飞智作“秒级声音&形象构建”功能页面
只需10秒以内的个人形象视频素材,通过AI算法提取外貌特征、声音特点等要素,系统能在极短时间内生成个人“数字化分身”。同时还支持形象模型的自训练、标准训练,满足虚拟人在不同场景下的应用需求。

根据真人主播生成的虚拟主播“安小佳”

根据真人主播生成的虚拟主持人“小俊“

黑龙江中医药大学王金环教授“数字分身”
教培、媒体传播、科技服务、客服导览、短视频制作等多种场景,涉及不同内容需求,讯飞智作都能很好地满足。
②行为驱动更真实:超拟人声音+AI生成动作
1月30日发布的星火语音大模型可实现超拟人对话,声音效果接近人类日常生活的口语表达状态,拥有呼吸叹气、变语速、停顿思考、轻重读、语气词(嗯、啊)等副语言能力。此外,大模型对情绪的感知度达85%+,能更生动地表达高兴、抱歉、撒娇、困惑等情绪。
目前超拟人声音已上线讯飞智作,包含“聆小琪”、“聆小珊”、“聆玉言”、”聆玉昭“、“聆飞哲”5款男女发音人。无论是日常闲聊,还是复杂专业的问答咨询,这样的声音都能更好地表达性格与情感。

超拟人声音 内容更真实
除声音之外,动作也是虚拟人交互的关键要素。大模型技术加持下,可以对语义文本进行深度理解,自动匹配和生成动作,让虚拟人动作更加自然、流畅和逼真,也更有生命力。

多样化姿态 场景更丰富

AI生成动作 互动更自然
目前讯飞智作新上线多款虚拟人形象,支持AI生成动作,搭配场景化视频模板,让内容效果更贴近真实场景。
③交互大脑有意识:虚拟人智能交互机再进化

虚拟交互的升级,意味着用户与虚拟人之间的沟通互动更自然、高效和智能。
作为一款集合先进语音识别、自然语言处理和机器学习技术的智能设备,虚拟人智能交互机在星火大模型加持下,不断升级其智能感知能力、语义理解能力、情感表达能力,让虚拟人与用户的“面对面”交流问答更有效、更开放。

目前,智能交互机已在金融、政务、文旅、商业、展会等多个领域大规模应用。圆明园、明中都、骆岗公园等景区,全国两会、北京冬奥会、成都大运会等重大场合,都能见到它。

明中都遗址公园虚拟导游小可进行景区导览

圆明园遗址公园虚拟导游可爱进行知识科普

科大讯飞打造的成都大运会虚拟志愿者小芙

虚拟人智能交互机亮相2023世界人工智能大会

北京冬奥虚拟志愿者爱加进行多语种交互问询
先进的星火大模型给虚拟人带来全面提升,不仅是外在形象、语言和动作上,更在于对虚拟人交互能力的升级,对虚拟人“自主意识”的增强,进而引领虚拟人“全新意识”。
作为新质生产力代表,讯飞智作始终坚持践行人工智能+,让虚拟人成为人类伙伴。
相关文章
- 全球首发|讯飞Astron开源项目矩阵,构建企业级智能体完整技术生态
- 2026中国翻译协会年会召开,科大讯飞携多语言AI翻译产品矩阵亮相并获评5A级企业认证
- 科大讯飞佛山人工智能产业基地正式启用,助力南海构建AI产业生态
- 科大讯飞重磅布局智能穿戴,讯飞AI眼镜开启跨语言沟通新时代
- 科大讯飞AstronClaw升级,引领AI Agent从对话走向执行
- 科大讯飞亮相2026联合国中文日,让语言无界,让文化共鸣
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
- 科大讯飞AIPC华东制造基地正式投产,软硬智造一体出场即“数字员工”
- 科大讯飞与苏移集成签署战略合作协议,共推具身智能产业升级
- 从硬件集成到软核共研,科大讯飞与北京人形机器人创新中心深化合作
- 中关村国际技术交易中心揭牌 讯飞 AI 眼镜亮相
- 科大讯飞与金光集团签约战略合作,携手推动印尼人工智能转型
- MWC 2026 | 科大讯飞全球首发AI眼镜,多款AI产品全新升级
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 科大讯飞AI学习机T90系列重磅发布,开启个性化学习新时代
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









