微美全息开发基于应用场景的虚拟数字人手势生成算法
2023-03-12 13:45:21爱云资讯901
在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断演化,形象越来越逼真,应用范围越来越广,商业价值越来越大,根据某市场研究机构推出的《虚拟数字人深度产业报告》预测,到2030年我国虚拟数字人整体市场规模将达到2700亿元。
虚拟数字人是基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术打造的、具有外貌特征、表演能力、交互能力等人类特征的复合体,其具有人的几何特性和行为特性。虚拟数字人从制作到外观的数字化,逐渐深入到行为的交互化、思想的智能化,其不仅具有人的外观和行为,还拥有人的思想,能够识别外界环境,并与人进行自然交互。
手势作为重要的交互方式,已被广泛应用在汽车导航、虚拟仿真等领域。虚拟数字人作为新一代的交互平台,能融合其他交互技术提供多模态的交互体验。通过建立抽象的交流意图与手势的物理实现之间的映射,生成丰富的手势,可让虚拟人的情感表现力更加丰富。
据了解,微美全息正在开发基于应用场景的虚拟数字人手势生成算法系统,通过环境的变化让虚拟数字人产生不同的动作。并不是虚拟数字人的每句话都要伴有手势,同一句话在不同场景下的手势也会有所不同,因此,对虚拟数字人的应用场景需进行深层次的设计。
将抽象的交流意图通过自然语言处理,再将文本映射到手势语义的分类中,构建语义分类模型。首先给出判断是否需要手势,因为手势是辅助和增强语义表达的,对于不确定是否需要手势的情况,倾向于给出不需要手势的结果。然后对所构建的不同场景的语料库进行统计,分析库中所有动作的模式及其与语义的对应关系,整理语料库中的有语义的动作,进行情感、手势隐喻语义、原始文本与手势量化描述语言的映射关系,并构建分类模型。从语义到手势量化描述的映射过程是一对多的分类问题。针对不同应用场景,使用不同语料库进行训练。对于同一个隐喻手势语义细分类别下的多个手势,采用自然语言处理技术,对手势文本与输入文本进行语义匹配,选择最匹配的手势。对于交流意图,通过自然语言理解,构建该文本到情感、手势隐喻语义的分类,与原始文本的关联关系,最终生成虚拟数字人手势。
虚拟数字人手势交互极大提升了其情感表现力。WIMI微美全息基于应用场景的虚拟数字人手势自动生成算法,利用隐喻手势的语义分类方法,构建手势的量化描述语言,为手势的语义可计算提供了量化方法,并提出了针对不同应用场景的情感语料库构建方法,并构建富有情感的语料库,为虚拟人手势生成算法研究提供了数据基础。
总的来说,当前虚拟数字人的理论和技术日趋成熟,应用范围也在不断扩大。虚拟数字人已经在金融、交通、物流、零售、制造业等多个行业得到应用,助力不同行业实现数智化转型。
相关文章
- Meta拟百亿美元投资Scale AI,微美全息端侧多模态AI加速开启科技新局
- 英伟达新一季财报再创新高,微美全息筑牢AI算力根基开拓百亿市场!
- 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建
- 苹果推进智能眼镜暗战谷歌,Meta/微美全息深耕AR赛道抢占XR市场新机遇
- 融合深度学习与量子计算,微美全息探索Grover算法量子神经网络模型
- 打造智能安全生态,微美全息探索大数据与区块链的融合应用
- 谷歌I/O大会将聚焦AI战略转型布局,腾讯/微美全息力推大模型与核心产业深度融合
- CyberSense脑机机器人研发突破壁垒,微美全息技术融合抢占千亿未来产业
- 英伟达发布Eagle 2.5视觉语言AI模型,xAI/微美全息凭高性价比AI模型展实力!
- 脑机接口实现“意念精准操控”,微美全息关键技术推动向实际应用转化
- 苹果全力研发增强现实AR眼镜,谷歌/微美全息夯实领先优势开启空间交互时代!
- OpenAI推出新一代开源模型,微美全息多线攻关促AI开源应用落地
- Ray-Ban Meta眼镜获AI加持,字节跳动/微美全息硬件+内容实力不容小觑
- 山东新政策赋能数字经济新动能,微美全息5G+AI引擎驱动产业数字化跃迁
- 阿里发布3D数字人模型开源引关注,微美全息多模态技术为AI虚拟人发展“添翼”
- Meta开源大模型Llama 4震撼发布,阿里巴巴/微美全息聚焦加速垂直领域AI应用布局