GLM-4-Plus在SuperCLUE基准测评和司南Compass Arena榜单均位居国内第一
2024-11-16 13:24:32爱云资讯129150
11月8日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》,智谱GLM-4-Plus凭借出色的能力表现,在43个国内外大模型中位居第一梯队,总得分位列国内大模型首位。
SuperCLUE中文大模型基准测评旨在通过多维度综合性测评,对国内外大模型的发展趋势和综合效果进行实时跟踪。本次10月报告聚焦通用能力测评,选取了国内外有代表性的43个大模型,采用多维度、多层次的综合性测评方案进行测评。测评结果显示,o1-preview的推出进一步拉大了与其他模型的差距,国内大模型第一梯队竞争激烈,持续迭代表现不俗。其中国内闭源模型GLM-4-Plus、SenseChat 5.5、AndesGPT-2.0表现优异,与ChatGPT-4o-latest相距2分以内。基于大模型在基础能力和应用能力的表现,共有23个国内大模型入选SuperCLUE模型象限。智谱GLM-4-Plus位居【卓越领导者】,代表模型在基础和场景应用上处于领先位置,引领国内大模型发展。
11月14日,在司南OpenCompass公布的大语言模型对战榜单Compass Arena中,智谱GLM-4-Plus的竞技场评级分数位列榜首,领先GPT-4o-20240513。
Compass Arena 大语言模型对战榜单致力于构建一个完全基于用户真实反馈的公正、开放、透明的榜单。用户根据与大模型的真实对话体验进行投票,依据投票结果,使用 Elo 评分系统对大模型进行排名。
据悉,GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,它标志着智谱继续瞄准通用人工智能,持续推进大模型技术的独立自主创新。作为智谱最新旗舰模型,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。GLM-4-Plus 成为智谱全模型家族坚实的能力底座,在代码计算、数据分析、图像/视频特征识别等领域均实现性能的大幅提升,及成本的大幅下降,目前已上线智谱开放平台。
相关文章
- Momenta飞轮大模型:AI也能动物友好
- 玄武云出席崔牛会AI活动,聊聊AI大模型如何掌握终端信息
- 容联云携手长江证券,打造证券大模型质检AI Agent标杆
- 百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!
- MWCSH 2025 | 中国移动携手华为发布网络运行大模型2.0
- 先进数通携手昆仑技术亮相2025中国国际金融展,共推“智能营销专家”大模型解决方案
- 2025 ECDC 萤石云开发者大会:锚定垂直场景大模型 全栈开放云服务
- 云从科技签约国家网安基地大模型训推一体化项目 打造AI安全新高地
- 华为云五大案例入选中国信通院“2025政务大模型典型案例”
- 大模型催化智算一体机爆发,政企市场成AI基建龙头角力焦点
- 华为云:CloudMatrix384突破大模型训推瓶颈,加速行业智能化跃迁
- HDC 2025:聚焦 AI-Native 安全,中国燃气携手华为云打造能源行业大模型安全标杆
- 华为云助力企业基于盘古大模型打造专业大模型,引领行业智能化变革
- 国内首家!商汤科技大装置万象获得中国信通院“大模型推理平台”最高评级认证
- 中国电信AI+网络能力发布大会召开 全球首个网络大模型联盟正式成立
- 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>- 从灵感到成片 三星Galaxy S25 Ultra让影像创作更高效
- 芯原推出经市场验证的ZSP5000视觉核心系列,扩展其面向边缘智能的数字信号处理器IP组合
- 从双城救援到DJI FC100发布:大疆无人机重塑应急救援新方式
- 大朋VR AI眼镜预发布,从 VR 领航者到 AI 穿戴开拓者
- 录音界的“黑科技”!索尼ICD-TX660:专业录音、高效随行
- 重磅!方芯半导体推出国产EtherCAT从站控制芯片,原位替代Microchip LAN9252/9253/9254
- 大疆发布旗舰级运载无人机DJI FC100:80kg载重、9分钟快充,开启无人机运载新时代
- 智能健康领域新突破:Ulook脑机智能眼镜正式上市,重新定义“眼-脑-心理”联动新范式