文心一言数学和中文理解能力全球第?清华最新报告出炉
2024-04-22 10:20:24AI云资讯1513
4月21日,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》,结果显示:文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。

在人类对齐能力评测中,文心一言4.0位居国内第一;中文理解上,文心一言4.0领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,和文心一言4.0分差超过1分。
在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中;在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。
在安全性评测上,国内模型文心一言4.0拿下最高分(89.1分),Claude-3仅列第四。

据悉,自文心一言首发至今,用户数已突破2亿。
相关文章
- 百度文心一言APP获推4.0.0 版本升级:更名文小言
- 百度薛苏:文心一言APP月活超千万,调用量超14亿
- 五一出游“含AI率”狂飙 文心一言APP旅游智能体用户首日暴增12倍
- 文心一言数学和中文理解能力全球第?清华最新报告出炉
- 百度李小婉:四大能力全面升级,文心一言APP专业版更流畅高效
- 百度Q3财报:营收344.47亿元 文心一言用户数已达7000万
- 小度全面拥抱文心一言,发布多款AI原生新物种
- 文心一言开放首日,百度搜索超3亿次需求由生成式智能引擎解决
- 金山办公:已与百度文心一言开展联合测试
- 百度袁佛玉:文心一言将改变云计算市场游戏规则
- 百度文库接入文心一言,国内首个生成式AI文档服务即将上线
- 万兴科技:已有商用账号开通GPT-4 API接口,旗下亿图将率先试用文心一言
- 中兴通讯服务器助力百度“文心一言”,开创AI新时代
- 李彦宏:文心一言对标ChatGPT门槛很高,百度在全球大厂中第一个做出来
- 文心一言发布在即 百度智能云升级三大配套云服务
- 百度将于3月16日围绕文心一言召开新闻发布会
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









