智象未来发布全新自回归图像编辑框架 VAREdit ,0.7 秒完成高保真图像编辑
2025-08-25 17:52:17AI云资讯2319
近日,智象未来团队正式推出全新自回归图像编辑框架 VAREdit,作为全球首个纯自回归的图像编辑模型,这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令,避免过度修改,还将编辑速度提升至0.7秒级,为实时交互与高效创作开辟新路径。

长期以来,扩散模型在图像编辑中虽能生成高质量画面,但存在局部修改牵动整体结构、编辑不够精准,以及多步迭代效率低等瓶颈。针对这一问题,VAREdit首次将视觉自回归(VAR)架构引入图像编辑任务。它将编辑定义为“下一尺度预测”,逐层生成多尺度残差特征,实现局部精准修改与整体结构保持的统一。同时,团队创新设计了尺度对齐参考(SAR)模块,有效解决尺度匹配难题,进一步提升编辑质量与效率。
在权威基准 EMU-Edit 与 PIE-Bench 测试中,VAREdit在CLIP与GPT等指标全面领先。其中,VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%;轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑,实现数倍提速。
目前,VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示,未来将持续探索视频编辑、多模态生成等应用场景,推动AI图像编辑迈入高效、可控、实时的新纪元。
相关文章
- 智象未来创始人兼首席执行官梅涛博士当选2025 ACM Fellow
- 卡位影视数字化转型风口 智象未来与长江影视战略合作 构建AI视觉生成产业闭环
- 智象未来团队荣获ACM Multimedia 2025最佳演示奖,多模态生成式AI技术领跑全球
- 智象未来荣获“专精特新”中小企业,以AI之力赋能视频创作新范式
- 智象未来发布全新自回归图像编辑框架 VAREdit ,0.7 秒完成高保真图像编辑
- 智象未来亮相 WAIC:多模态智能体,重塑创作的未来版图
- 智象未来两项研究入选ICCV 2025,发布两项视觉生成突破性成果
- 智象未来与华为云签署全面合作协议,共同探索人工智能落地应用创新典范
- 智象未来两篇论文入选 CVPR 2025!视频生成与虚拟换装齐破局,开源赋能产业革新
- 彩讯股份与智象未来达成战略合作,推动多模态大模型及AI应用落地
- 2024世界制造业大会圆满落幕,智象未来(HiDream.ai)助推产业智能化
- 领航创意制作,智象未来(HiDream.ai)推动视觉内容产业迈向新高地
- 领跑AIGC领域技术,智象未来开启文旅宣传新篇章
- 推动视觉AI边界,智象未来(HiDream.ai)荣登全球技术先锋榜单
- 智象未来在文生视频时代的突破与展望
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









