商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
2024-10-14 13:53:36AI云资讯9219
在这个金秋,“日日新·商量”又拿了金牌!
今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。凭借卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。
今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。凭借卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。
SenseChat-Vision5.5基础能力突出,
数理逻辑维度超越GPT-4o
本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基础能力和应用能力两个大方向,以开放式问题形式对多模态大模型进行评估,涵盖了8个一级维度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。
前瞻构造高阶思维逻辑数据,
用推理能力增强AI大模型智能
如今,复杂推理成为各模型之间的重要能力壁垒。对于大模型能力的分层,商汤科技董事长兼CEO徐立此前就提出三层架构(KRE)理论,即:第一层知识(Knowledge),世界知识的全面灌注;
第二层推理(Reasoning),理性思维的质变提升;
第三层执行(Execution),世界内容的互动变革。
目前,SenseChat5.5已经应用在商量网页版(WEB)——一款擅长高效搜索、整理、输出信息的智能应用,工作、学习、生活中的任何问题,问问商量,都能解决。
相关文章
- 超越芯片预设上限!记忆张量与商汤大装置实现国产 GPGPU 体系级性能与成本双突破
- 商汤大装置获信通院“算模数用”三大奖项,彰显AI基础设施全栈实力
- 商汤元萝卜联动疯狂动物城推出朱迪系列新品,以用户体验传递成长力量
- 上海博物馆×商汤科技:AI助手上线,逛馆告别“人挤人”
- 商汤科技与正大集团共探AI与实体经济融合新机遇
- 商汤大装置AI Agent Infra实践,加速智能时代创新效能
- 商汤杨帆出席2025年国家网安周企业家座谈会
- 商汤大装置赋能绿盟科技,助力风云卫AI安全能力平台建设
- 商汤2025年中期业绩超市场预期:半年营收达24亿元,同比飙升36%
- 商汤2025年中期业绩:营收超市场预期达24亿元,同比增长36%
- 商汤大装置跻身中国大模型平台市场头部厂商,万象平台加速AI落地“最后一公里”
- 重磅!商汤元萝卜联动疯狂动物城发布朱迪系列新品
- 商汤科技连续九年领跑中国计算机视觉市场,CV 2.0时代再显龙头实力
- 千亿市场国产化!紫光汉图X商汤日日新:多模态AI打造“会判作业”的打印机
- 商汤大装置 x 铁一院:多模态大模型赋能铁路勘察设计,让70年经验“活”起来
- 商汤大装置×铁一院达成深度合作,大模型赋能铁路工程设计









