微美全息开发基于应用场景的虚拟数字人手势生成算法
2023-03-12 13:45:21AI云资讯1107
在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断演化,形象越来越逼真,应用范围越来越广,商业价值越来越大,根据某市场研究机构推出的《虚拟数字人深度产业报告》预测,到2030年我国虚拟数字人整体市场规模将达到2700亿元。
虚拟数字人是基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术打造的、具有外貌特征、表演能力、交互能力等人类特征的复合体,其具有人的几何特性和行为特性。虚拟数字人从制作到外观的数字化,逐渐深入到行为的交互化、思想的智能化,其不仅具有人的外观和行为,还拥有人的思想,能够识别外界环境,并与人进行自然交互。
手势作为重要的交互方式,已被广泛应用在汽车导航、虚拟仿真等领域。虚拟数字人作为新一代的交互平台,能融合其他交互技术提供多模态的交互体验。通过建立抽象的交流意图与手势的物理实现之间的映射,生成丰富的手势,可让虚拟人的情感表现力更加丰富。
据了解,微美全息正在开发基于应用场景的虚拟数字人手势生成算法系统,通过环境的变化让虚拟数字人产生不同的动作。并不是虚拟数字人的每句话都要伴有手势,同一句话在不同场景下的手势也会有所不同,因此,对虚拟数字人的应用场景需进行深层次的设计。
将抽象的交流意图通过自然语言处理,再将文本映射到手势语义的分类中,构建语义分类模型。首先给出判断是否需要手势,因为手势是辅助和增强语义表达的,对于不确定是否需要手势的情况,倾向于给出不需要手势的结果。然后对所构建的不同场景的语料库进行统计,分析库中所有动作的模式及其与语义的对应关系,整理语料库中的有语义的动作,进行情感、手势隐喻语义、原始文本与手势量化描述语言的映射关系,并构建分类模型。从语义到手势量化描述的映射过程是一对多的分类问题。针对不同应用场景,使用不同语料库进行训练。对于同一个隐喻手势语义细分类别下的多个手势,采用自然语言处理技术,对手势文本与输入文本进行语义匹配,选择最匹配的手势。对于交流意图,通过自然语言理解,构建该文本到情感、手势隐喻语义的分类,与原始文本的关联关系,最终生成虚拟数字人手势。

虚拟数字人手势交互极大提升了其情感表现力。WIMI微美全息基于应用场景的虚拟数字人手势自动生成算法,利用隐喻手势的语义分类方法,构建手势的量化描述语言,为手势的语义可计算提供了量化方法,并提出了针对不同应用场景的情感语料库构建方法,并构建富有情感的语料库,为虚拟人手势生成算法研究提供了数据基础。
总的来说,当前虚拟数字人的理论和技术日趋成熟,应用范围也在不断扩大。虚拟数字人已经在金融、交通、物流、零售、制造业等多个行业得到应用,助力不同行业实现数智化转型。
相关文章
- 苹果提速研发AI眼镜,高通/微美全息构建多维触达矩阵抢占穿戴消费风潮!
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- OpenAI 新模型密集更新,Meta/微美全息强化布局AI核心需求迎爆发增长!
- 脑机接口开启“数字桥梁”新局,微美全息(WIMI.US)多路创新探索并进风头正劲!
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 亚马逊250亿加盟豪掷Anthropic,微美全息深耕Agent与AIGC赛道拓版图!
- AI芯片竞争战火升级,特斯拉/Meta/微美全息自研硬核实力发起行业冲锋革命!
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- Meta闭源模型Muse Spark登场,谷歌/微美全息加码投入开源AI“严阵以待”
- 6G与AI融合通信范式迎变革,微美全息加速构建“6G+云计算”产业生态
- Meta奏响“百镜大战”热潮序曲,Snap/苹果/微美全息融合AR与AI强势入场
- 2026上海量子科技盛会启幕,微美全息领衔构建AI+量子生态拓宽万亿新蓝海
- 马斯克豪掷200亿扩建“芯片工厂”,微美全息多路突围协同领衔AI算力格局!
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 2026 AI智能体端侧变革来袭,微软/微美全息押注生成式Agent开启高成长篇章
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









