GLM-4-Plus在SuperCLUE基准测评和司南Compass Arena榜单均位居国内第一
2024-11-16 13:24:32AI云资讯129508
11月8日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》,智谱GLM-4-Plus凭借出色的能力表现,在43个国内外大模型中位居第一梯队,总得分位列国内大模型首位。


SuperCLUE中文大模型基准测评旨在通过多维度综合性测评,对国内外大模型的发展趋势和综合效果进行实时跟踪。本次10月报告聚焦通用能力测评,选取了国内外有代表性的43个大模型,采用多维度、多层次的综合性测评方案进行测评。测评结果显示,o1-preview的推出进一步拉大了与其他模型的差距,国内大模型第一梯队竞争激烈,持续迭代表现不俗。其中国内闭源模型GLM-4-Plus、SenseChat 5.5、AndesGPT-2.0表现优异,与ChatGPT-4o-latest相距2分以内。基于大模型在基础能力和应用能力的表现,共有23个国内大模型入选SuperCLUE模型象限。智谱GLM-4-Plus位居【卓越领导者】,代表模型在基础和场景应用上处于领先位置,引领国内大模型发展。

11月14日,在司南OpenCompass公布的大语言模型对战榜单Compass Arena中,智谱GLM-4-Plus的竞技场评级分数位列榜首,领先GPT-4o-20240513。
Compass Arena 大语言模型对战榜单致力于构建一个完全基于用户真实反馈的公正、开放、透明的榜单。用户根据与大模型的真实对话体验进行投票,依据投票结果,使用 Elo 评分系统对大模型进行排名。

据悉,GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,它标志着智谱继续瞄准通用人工智能,持续推进大模型技术的独立自主创新。作为智谱最新旗舰模型,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。GLM-4-Plus 成为智谱全模型家族坚实的能力底座,在代码计算、数据分析、图像/视频特征识别等领域均实现性能的大幅提升,及成本的大幅下降,目前已上线智谱开放平台。
相关文章
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 因果大模型如何让垂直领域智能体“可解释”?零犀科技交付可靠结果的实践
- 微通人工智能科技到访百度智能云创新基地 共探大模型落地与企业AI转型新路径
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
- 腾讯云与闪铸战略合作 混元3D大模型助力3D打印产业场景落地
- 同济大学 × 海光信息:筑牢高校大模型安全运行底座
- 重磅!中国首个民航端侧大模型标准发布 浩鲸科技牵头
- 26年大模型应用开发从现在开始学!稳了!
- 零犀科技:因果大模型+行业智能体,一家大模型应用标杆企业的技术底色与商业化路径
- 良策金宝AI 荣获 2026 GAIC“年度工程AI创新领军奖”,以垂直大模型推动“人工智能+工程设计”深度融合
- 绿盟科技大模型安全白皮书发布:聚焦智能体风险与防护,护您安全“养虾”
- 智爱客餐饮 AI 大模型获星河产业创新奖 构建餐饮AI新动能
- 卓世科技CEO屠静荣膺“大模型2025年度人物”
- 中易物联集团入选百度大模型生态伙伴 筑牢餐饮 AI 技术底座
- 紫光云发布行业垂类大模型,打造AI全栈落地方案
- 全员顶尖大模型及AI 编程工具保障,云知声开启 AI Native 组织进化









