Soul成果亮眼:实时人像视频生成研究成果被CVPR2025录用
2025-06-04 15:09:06爱云资讯981
近日,AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》,成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破,更意味着其在AI社交领域的探索,正逐步引领行业走向新的阶段。
CVPR作为计算机视觉与模式识别领域的标杆会议,一直以高水准的录用标准著称。根据会议官方统计,本次CVPR 2025会议总投稿13008篇,录用2878篇,录用率仅为22.1%,竞争可谓异常激烈。Soul App此次入选,彰显其技术实力得到了学术界与行业的高度认可。
事实上,这并非Soul在AI领域的首次亮相。2024 年,Soul多模态情感识别研究论文入选ACM国际多媒体会议研讨会,且在国际人工智能联合会议组织的挑战赛中,Soul技术团队在半监督学习赛道拔得头筹。从2016年上线基于AI算法的灵犀引擎,到2023年推出自研语言大模型Soul X,再到如今多模态端到端大模型的升级,Soul始终坚定不移地深耕AI社交领域。
此次被录用的论文,提出了全新的实时音频驱动人像动画自回归框架。该框架创新性地将talking head任务拆分为面部Motion生成和高效身体Movement生成模块,不仅大幅提升了视频生成效率,更显著优化了生成效果的自然度和拟人性。这一成果,是Soul在语音、视觉、NLP融合方面的一次积极探索,为打造更真实的AI社交交互体验奠定了基础。
此前,Soul基于多模态大模型上线的语音交互功能,收获了用户的广泛好评。如今,从语音到视觉的交互模态升级,无疑将为用户带来更为沉浸式的社交体验。未来,Soul计划将这一技术成果应用于实时视频通话、AI虚拟人情感化陪伴等多元场景,进一步提升人机交互的情感温度。
Soul在AI社交领域的持续创新,不仅为用户带来了更优质的体验,也为整个行业的发展指明了方向。在未来,Soul将凭借其在AI技术上的深厚积累,继续打造充满趣味与温暖的社交空间,推动AI社交迈向新的高度。
相关文章
- SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
- 《Global Talk》对话生数科技:国产视频生成模型Vidu 2.0引领视频生成进入“秒级时代“
- 昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
- 基于豆包·视频生成模型打造创新体验,即梦成为“想象力的相机”
- 抢先OpenAI Sora谷歌新推Veo模型,亚马逊/微美全息加入AI视频生成竞赛引关注
- OpenAI正式推出AI视频生成模型Sora 可生成长达20秒的视频
- 中国电信发布全自研视频生成大模型 完成全模态体系构建,首届TeleAI 开发者大会在穗举办
- MOKI升级AI脚本、AI分镜、AI视频生成功能,进一步增强成片效果
- Meta宣布推出人工智能视频生成器Movie Gen
- 即梦AI接入豆包·视频生成模型,打造更高质量智能化创作体验
- 豆包大模型发布视频生成模型,语义理解精准、画质高保真
- 蓝色光标Blue AI携手快手可灵AI,共同引领AI视频生成新时代
- 量子位智库发布《AI视频生成研究报告》 OpenAI万兴科技Adobe美图等入选代表企业
- WAIC 2024|首个“可控”人物视频生成大模型来了 分钟级人物视频AIGC一键生成
- 虹软PSAI入驻抖店,AIGC视频生成功能率先上线1688平台
- 第三届美图影像节倒计时,美图或将发布视频生成新产品