AI修图越玩越6!行业首个应用级图像大模型发布,懂摄影会思考还能秒出片
2025-03-31 16:01:27AI云资讯6459
3月31日,AI修图领军品牌像素蛋糕重磅发布摄影行业首个应用级图像大模型——方糖大模型,专注于为摄影师、修图师及图像创作者,解决摄影修图场景的复杂难题。目前,部分功能已在网页端邀测上线,同时用户可在软件内申请内测、限免体验。
全球AI竞赛走到了下半场。
据MarketsandMarkets报告,垂类AI应用的市场规模将从2024年的51亿美元大幅增长至2030年约471亿美元,2032年还可能超过1000亿美元。
“不卷参数卷应用”成为AI行业共识。当技术回归场景本质,AI如何真正落地解决特定场景的实际问题,是这场竞赛的突围关键点。应用级AI工具的下一个“DeepSeek时刻”将何时来临?那些能精准洞悉并解决行业痛点的垂类AI工具,正悄然构建新的商业护城河。
摄影行业首个应用级图像大模型
3月31日,AI修图领军品牌像素蛋糕迎来春季发布会,像素系列产品多项新功能正式亮相。既去年AI语义追色功能发布后,在半年内又带来技术革新。会上,像素蛋糕重磅发布了行业首个应用级图像大模型——方糖大模型,专注于为摄影师、修图师及图像创作者,解决摄影修图场景的复杂难题。
方糖大模型的发布,无疑给出了摄影垂直领域的第一个AI落地新范式。
据了解,现阶段方糖大模型有几大核心效果优势:
1、懂摄影,会思考
作为目前行业里最懂摄影的大模型,方糖大模型就像一个影像大脑,能读懂一张照片的摄影构图、景深、光影、纹理、风格,因此在处理图像时几乎能像人一样思考,专精于解决摄影后期疑难杂症。举例来说,「AI祛路人」是基于方糖大模型技术下的应用落地功能,经过实测对比相同测试环境下的千张图像处理效果,在与Adobe Photoshop 2025 及 iPhone 16 Pro Max的较量中,「AI祛路人」无论是在检测与分割精准度,还是祛除与生成还原度等指标上,均表现良好,实现了不同程度的领先。


2、好操作,响应快
即开即用,才是真的生产力。无需下指令,百亿算力点击即用,复杂问题一步搞定。仍以「AI祛路人」为例,它的操作简单到甚至只需一个步骤,几秒间就能完成路人检测、框选、涂抹、擦除、修补、融合等多个费时费力的修图步骤。

3、更专业,更可控
通用图像大模型的不足在于,以文生图及图生图操作,AI 生图需要抽卡,生成结果不可控,难以控制面部、手部、背景等图像细节的精确性。而方糖大模型的优势在于,虽然功能简化了操作,但仍保留了专业级的控制选项,全流程可编辑,实现了更高的控制度。
以上三点意味着,无论你是经验丰富的摄影师、专业修图师,还是摄影爱好者,它都能在你的后期工作流中上大分。
垂直赛道跑出国研黑马
在越来越卷的AI赛道,产品之间也越来越难拉开差距,厂商的行业沉淀及自研技术就显得尤为重要。作为一家拥有16bit·AI Raw引擎技术、AI中性灰算法模型、Human-parsing·人体解析技术、Face-parsing·人脸解析技术、万物分割技术等多项独家技术的软件厂商,像素蛋糕已在商业摄影领域默默耕耘多年。
据了解,早在2021年,像素蛋糕就已发布了行业首个支持端侧计算的可视化编辑工具,通过AI修图重塑了由Adobe Photoshop开创的数码后期流程;2022年,发布16bit AI·Raw引擎,成为国内唯一拥有Raw引擎核心技术的软件厂商,让超色彩视域的专业调色成为可能;2023年,发布业界首个AI修图+联机拍摄的软件硬件直联方案,率先将AI调色、AI局部调色等前沿技术应用于产品的创新;2024年,首创发布一体化解决方案,同时开创性发布独家AI语义追色,再次颠覆传统工作流。
4年过去,像素蛋糕已快速成长为了这条赛道的行业引领者。凭借一系列技术上的创新与极佳的用户口碑,构建起差异化的显著竞争优势。这背后,亦离不开像素蛋糕对行业痛点及用户需求的深刻洞察。谈及为什么要自研大模型,像素蛋糕团队解释,“从研发到应用,我们花了800多天时间。这虽然是一条艰难的路,不过对我们来说,最重要的还是真正能解决用户的问题。”
“我们的用户大部分是专业的摄影师、修图师。他们告诉我们一件很重要的事——他们需要的是可控的AI工具,而不是一键式的傻瓜操作工具。所以我们把工具的控制权还给用户,让用户决定每一步该怎么走。我们的职责是解决问题,但绝不替用户做决定。”
下一个十年,应用级图像大模型将如何引领行业变革?像素蛋糕在AI重塑摄影生产力的长卷上,刚刚写下序章。
懂摄影,秒修片的方糖大模型,已装进像素蛋糕。部分功能已在网页版邀测上线,用户可在软件内申请内测、获取限免体验。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









