昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题
2025-07-31 15:40:36AI云资讯1935
随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。浙江大学 鲲鹏昇腾科教创新卓越中心计算机学院研究员朱霖潮团队基于此课题持续深耕并取得重要进展。依托昇腾AI基础软硬件平台,该团队提出的技术方案有效提升了长视频内容一致性,同时显著优化了视频生成过程中的计算效率。
针对长序列视觉指令生成的核心技术难题,项目团队成功研发首个无需训练的长序列视觉指令生成框架LIGER,实现了历史提示和视觉记忆机制,以及基于DDIM反演的记忆校准技术。依托昇腾的编码加速能力,通过对每个步骤的图像特征进行采样和存储,捕捉前序步骤中的关键视觉信息,并将其注入到自注意力机制中,确保步骤间的视觉连贯性。同时,通过自反思机制纠正图像中的属性错误、逻辑错误、对象冗余和身份不一致等问题,使用多种图像编辑工具进行精确修正。该系统在长序列任务中展现出优异的逻辑连贯性和对象属性准确性,显著提升了视觉指令的理解性和实用性。
在计算效率方面,项目团队提出了基于昇腾平台优化的引导式渐进蒸馏方法,通过在线教师引导、渐进式蒸馏和高频细节保护三项关键技术,成功加速了视频扩散模型的生成过程。该方法让教师模型实时优化学生模型的中间预测以创建自适应训练目标,通过多阶段训练逐步增加步长将复杂轨迹学习分解为可管理的任务,并引入频域损失函数保持视频精细细节。在保持视频高质量输出基础上,该方法实现8倍加速。
该项目创新性地将大语言模型推理能力与视频生成技术相结合,为多模态交互研究开辟了新方向。目前,研究成果已成功入选人工智能顶级会议ICLR 2025,获得国际学术界的高度认可。项目构建的包含569个任务的评估数据集,为后续研究提供了重要基准。
未来,浙江大学 鲲鹏昇腾科教创新卓越中心将依托昇腾AI基础软硬件平台,持续深化产学研协同创新,着力突破多模态生成技术的核心瓶颈,构建自主创新、技术领先的多模态生成技术生态体系,并为国家人工智能战略与数字经济发展储备核心创新力量。

相关文章
- 睿思智联获昇腾 Atlas 800T/800I A3 认证:从 “能用” 到 “好用” 定义国产智算精细化管理新标准
- 昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
- 昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA
- 巅峰对决松山湖!鲲鹏昇腾创新大赛全国总决赛2025圆满落幕
- 以创新赴约,为未来赋能!鲲鹏昇腾创新大赛2025全国总决赛即将开赛
- 中国电信TeleStudio:深度适配华为昇腾算力底座,开启AIGC普惠新时代
- 助力打造“数智龙华”AI CITY先锋城区,“鸿蒙+昇腾”双生态数字孪生平台成功落地
- 昇腾生态硬核赋能!上交大攻克超长上下文推理难题,性能大幅跃升
- 从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案
- 昇腾384超节点深圳首秀!光明实验室携手华为开启国产AI生态“新丝绸之路”
- AI时代“国之重器”:基于昇腾的国产AI生态主题特展亮相高交会
- 凝“芯”聚力,淬炼成“钢” | 昇腾“淬火行动”北京专场点燃伙伴开发者创新引擎
- 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路
- 国产算力部署推理新突破!联通元景万悟发布MinerU 昇腾方案,部署周期缩短1倍,推理性能提升50%!
- HC2025丨高校创新力量“花开”开发者日,鲲鹏昇腾使能科研创新
- 华为全联接大会2025首发《算力珠玑》十大实战案例助力开发者攻克鲲鹏、昇腾开发难关









