GLM-4-Plus在SuperCLUE基准测评和司南Compass Arena榜单均位居国内第一
2024-11-16 13:24:32AI云资讯129332
11月8日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》,智谱GLM-4-Plus凭借出色的能力表现,在43个国内外大模型中位居第一梯队,总得分位列国内大模型首位。
SuperCLUE中文大模型基准测评旨在通过多维度综合性测评,对国内外大模型的发展趋势和综合效果进行实时跟踪。本次10月报告聚焦通用能力测评,选取了国内外有代表性的43个大模型,采用多维度、多层次的综合性测评方案进行测评。测评结果显示,o1-preview的推出进一步拉大了与其他模型的差距,国内大模型第一梯队竞争激烈,持续迭代表现不俗。其中国内闭源模型GLM-4-Plus、SenseChat 5.5、AndesGPT-2.0表现优异,与ChatGPT-4o-latest相距2分以内。基于大模型在基础能力和应用能力的表现,共有23个国内大模型入选SuperCLUE模型象限。智谱GLM-4-Plus位居【卓越领导者】,代表模型在基础和场景应用上处于领先位置,引领国内大模型发展。
11月14日,在司南OpenCompass公布的大语言模型对战榜单Compass Arena中,智谱GLM-4-Plus的竞技场评级分数位列榜首,领先GPT-4o-20240513。
Compass Arena 大语言模型对战榜单致力于构建一个完全基于用户真实反馈的公正、开放、透明的榜单。用户根据与大模型的真实对话体验进行投票,依据投票结果,使用 Elo 评分系统对大模型进行排名。
据悉,GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,它标志着智谱继续瞄准通用人工智能,持续推进大模型技术的独立自主创新。作为智谱最新旗舰模型,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。GLM-4-Plus 成为智谱全模型家族坚实的能力底座,在代码计算、数据分析、图像/视频特征识别等领域均实现性能的大幅提升,及成本的大幅下降,目前已上线智谱开放平台。
相关文章
- 开启品牌评估智能模式:元景品牌价值人工智能大模型重磅发布
- 小鹏科技日:第二代VLA大模型与三大具身智能产品齐发 勾勒物理AI未来出行新图景
- 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛
- 小鹏第二代VLA发布:首个量产物理世界大模型 智驾再进化
- 佳都科技三季报盈利态势稳续,研发赋能AI交通大模型
- 从典型应用到行业标杆,宜兴“天机镜”大模型将于11月5日 诠释城市安全治理新未来
- 产业AI大模型万联摩尔上线,从“通用”到“专用”的必然路径
- 云从科技入选大模型一体机产业图谱 以全栈能力推动AI落地新范式
- 百度王海峰:通用大模型与场景大模型相辅相成 并非割裂
- “工具”到“伙伴”:科大讯飞展示大模型如何助力教育减负增效
- 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验
- 讯飞星火燎原86届教装展,全栈自主可控国产教育大模型助推教育数字化转型
- 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验
- 云知声AGI落地智慧生活:推出“智能拍学机”等多款“智能硬件+大模型”解决方案
- 128 卡 4 天时间!百度百舸助力 LLaVA-OneVision-1.5 刷新多模态大模型训练效率纪录
- AI防护,与时俱进:信通院X电子科大X腾讯云共话大模型安全









