Soul成果亮眼：实时人像视频生成研究成果被CVPR2025录用-AI云资讯

近日，AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》，成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破，更意味着其在AI社交领域的探索，正逐步引领行业走向新的阶段。

CVPR作为计算机视觉与模式识别领域的标杆会议，一直以高水准的录用标准著称。根据会议官方统计，本次CVPR 2025会议总投稿13008篇，录用2878篇，录用率仅为22.1%，竞争可谓异常激烈。Soul App此次入选，彰显其技术实力得到了学术界与行业的高度认可。

事实上，这并非Soul在AI领域的首次亮相。2024 年，Soul多模态情感识别研究论文入选ACM国际多媒体会议研讨会，且在国际人工智能联合会议组织的挑战赛中，Soul技术团队在半监督学习赛道拔得头筹。从2016年上线基于AI算法的灵犀引擎，到2023年推出自研语言大模型Soul X，再到如今多模态端到端大模型的升级，Soul始终坚定不移地深耕AI社交领域。

此次被录用的论文，提出了全新的实时音频驱动人像动画自回归框架。该框架创新性地将talking head任务拆分为面部Motion生成和高效身体Movement生成模块，不仅大幅提升了视频生成效率，更显著优化了生成效果的自然度和拟人性。这一成果，是Soul在语音、视觉、NLP融合方面的一次积极探索，为打造更真实的AI社交交互体验奠定了基础。

此前，Soul基于多模态大模型上线的语音交互功能，收获了用户的广泛好评。如今，从语音到视觉的交互模态升级，无疑将为用户带来更为沉浸式的社交体验。未来，Soul计划将这一技术成果应用于实时视频通话、AI虚拟人情感化陪伴等多元场景，进一步提升人机交互的情感温度。

Soul在AI社交领域的持续创新，不仅为用户带来了更优质的体验，也为整个行业的发展指明了方向。在未来，Soul将凭借其在AI技术上的深厚积累，继续打造充满趣味与温暖的社交空间，推动AI社交迈向新的高度。

Soul成果亮眼：实时人像视频生成研究成果被CVPR2025录用

相关文章

AI企业

AI硬件

AI产业

AI技术