大语言通用能力第一!多模态图像理解能力第一!
2025-03-14 11:15:51AI云资讯16285
据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤“日日新”融合大模型斩获国内第一梯队成绩。
其中,核心的通用基础能力与多模态图像理解能力上,商汤“日日新”实现双双登顶,在16家国产主流大模型中排名第一。

通用基础能力:三大维度全面领先
此次评测的“通用基础能力”涵盖数理科学、语言能力和道德风险控制三大核心维度。商汤日日新在这三个方面均表现出色,位列第一,得分超越国际均线,展现出多维度的综合优势。
数理科学能力方面,商汤日日新以 88 分的高分位列第二,在数学推理、代码编写、科学常识等细分领域,展现出极强的逻辑推理和计算能力。报告特别指出,逻辑推理和数学能力已成为衡量大模型实力的关键分水岭。而商汤在这方面的优势尤为显著。
语言能力方面,在意图理解、角色扮演、开放式推理等方面表现优异,尤其是在语境适应性、指令遵循及输出稳定性上表现出色,确保了生成内容的准确性和一致性。
道德责任能力方面,以 75.88 分的成绩位居榜首,在风险信息识别、偏见控制等方面表现突出,充分体现了商汤在伦理安全与风险控制上的严格标准。
多模态能力:图像理解与生成双突破在多模态能力评测中,商汤日日新同样表现亮眼。在多模态图像理解能力评测中,商汤日日新以 84.05的高分位居榜首,在文字识别、物体定位、图像风格识别、图片逻辑理解等九个细分维度中夺得三项第一,显示出强大的图像理解能力。
其中,文字识别能力在复杂背景和低质量图像中表现远超中国及国际行业平均水平;物体定位能力精准度国内领先;图像风格识别准确率显著高于中国大模型均线。
在多模态生成能力评测中,商汤秒画在商业型和艺术型图像生成方面表现优异,尤其是在商业图像生成中,图像质量、指令遵循和风格多样性得分领先,展现出强大的技术实力和应用潜力,能够很好地满足广告、电商等商业场景的需求。
专业应用能力:多行业场景表现优异在专业应用能力评测中,商汤日日新同样处于第一梯队,位居前二。其综合能力涵盖 AI 智能体、专业文本处理及超长文本处理,展现出在复杂决策、专业知识理解与长文本推理方面的强大能力。
在行业应用能力方面,商汤日日新在金融、医疗、政务、教育等 14 个行业场景中均表现优异,体现了其对不同领域知识的深度理解和应用能力,以及强大的行业适配性和落地能力。
自 2023 年 4 月首次发布以来,日日新 SenseNova 大模型体系已进行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行业内率先实现了原生融合模态训练的突破,打破了大语言与多模态分立的局面,支持文本、图像、视频、语音等多源异构信息的综合处理,为多场景应用奠定了坚实基础,推动了AI大模型的工业化发展。
相关文章
- 全球首个大一统多模态视频模型可灵O1发布 让P视频像P图一样简单
- 合合信息入选“科创板价值50强”,多模态文本智能技术助推AI应用升级
- 小度AI眼镜Pro获评WISE2025年度焦点产品奖,多模态交互定义硬件新形态
- Tech Times:灵光6天200万次下载,中国首款多模态 AI助手并非“昙花一现”
- 昆仑万维正式发布Skywork R1V4-Lite,多模态智能体迈向开放式交互时代
- 智象未来团队荣获ACM Multimedia 2025最佳演示奖,多模态生成式AI技术领跑全球
- 128 卡 4 天时间!百度百舸助力 LLaVA-OneVision-1.5 刷新多模态大模型训练效率纪录
- 当虹科技率先发布ShowBiz AI2.0,以空间视频与AI多模态技术引领国产AIGC新赛道
- 华为马鹏:语音单模态到多模态通信,AI通话打造运营商业务入口
- 以科技创新推动产业创新专题 | 5倍提升!ShortDF突破多模态模型质、效困局
- ConvoAI&RTE2025 技术专场报名中丨多模态和语音 AI 年度收官大会!
- 快手发布多模态大模型Keye-VL-1.5 8B性能领先、视频理解能力更强
- 声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互
- 火山引擎多模态数据湖落地深势科技,提升科研数据处理效能
- 千亿市场国产化!紫光汉图X商汤日日新:多模态AI打造“会判作业”的打印机
- Skywork Deep Research Agent重磅升级!带来更多模态、更高质量和更高效的体验









