《人工智能大模型体验报告2.0》出炉:讯飞星火夺冠,得分逼近人类
2023-08-15 15:22:01AI云资讯1967
今年以来,国内科技企业纷纷布局人工智能大模型。为进一步直观感受我国当前主流科技企业所推出的大模型产品的现状、优势和特点,8月12日,新华社研究院中国企业发展研究中心基于严格测评,发布《人工智能大模型体验报告2.0》,对当前国内各主流大模型的表现给出评述。

与2023年6月首次发布的《人工智能大模型体验报告》相比,本次测评在题目设计、对标Benchmark(人类)、打分权重、专家测评团队四大维度进行了全面升级。
其中,在题目设计方面,测评题目由300道扩展至500道,并进一步完善了题目分类;
在对标Benchmark方面,本次测评将接受过高等教育的人类作为对照,来考评大模型真实能力;
在打分标准上,本次测评根据对产业、生活的实际价值,对基础能力、智商能力、情商能力和工具提效四大测评维度进行了权重设计;
在测评团队方面,本次测评特邀北京大学文化与传播研究所及其他产界、学界专家全程参与。
本次研究设置了用户体验项目,抓取了7月31日—8月4日数据,通过人机互动提问等形式,对国内主流大模型进行使用体验评测,旨在为科技企业调整努力方向提供参考。
报告显示,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。
具体来看,讯飞星火在工作提效、智商等方面优势明显,百度文心一言基础能力出色,商汤商量则在情商方面表现优秀,智谱AI-ChatGLM整体表现不俗。
归结到基础能力、智商能力、情商能力和工具提效四大维度综合得分上,科大讯飞星火表现最强,1013分,逼近人类水平(1014分),其次是百度文心一言和商汤商量,总分分别为1010分和983分。

报告认为,虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
据了解,此次测评总分第一的讯飞星火大模型发布于5月6日。并于6月9日发布星火1.5版本,与上一个版本相比,升级版不仅各项能力获得持续提升,且在综合能力上实现了三大升级:

开放式知识问答取得突破,提升24%,较好地解决了当前大模型技术有待攻克的“三大缺陷”:新知识难以更新、事实类问答容易“张冠李戴”、史实传统典籍等容易“编造情节”。
多轮对话跃迁,对话体验更接近真人;逻辑和数学能力明显提升。
特别是在数学能力,科大讯飞星火大模型不但能综合应用方程、排列组合、经典算法等各种数学方法,给出正确答案,而且能给出分析过程,让用户在“知其然”的同时,还能“知其所以然”。
除了大模型自身能力进一步提升外,讯飞星火1.5版发布会上,科大讯飞还正式发布了星火APP和星火语伴APP等C端产品,加上此前已和大模型融合的科大讯飞AI学习机、智能智能办公本、讯飞听见、汽车智能座舱语音交互和数字员工等产品,成为业内第一家实现大模型商业应用落地的公司。
受大模型加持带动,2023年5月至6月,科大讯飞C端硬件GMV创历史新高,同比翻倍增长。其中,搭载讯飞星火认知大模型的讯飞AI学习机GMV在5月和6月分别增长136%和217%。
同时,讯飞人工智能开放平台的开发者团队数量增长迅猛,两个月时间增加85万。截至2023年6月30日,科大讯飞开放平台开发者数已达到497.4万,近一年增长45%。
相关文章
- 上海交通大学人工智能赋能大健康战略论坛暨“百卅交大·终身思源”校友返校日活动成功举办
- 富光携手全球青少年人工智能竞赛,以智能科技护航青少年科创梦想
- 微通人工智能科技到访百度智能云创新基地 共探大模型落地与企业AI转型新路径
- 中国移动联合主办2026中关村论坛“量子科技与人工智能融合发展”平行论坛
- 维基百科禁止人工智能生成文章
- 苹果或将允许用户选择人工智能聊天机器人接入Siri
- 光云科技旗下萝卜塔智能体入选“2026人工智能应用创新优秀成果”
- 良策金宝AI 荣获 2026 GAIC“年度工程AI创新领军奖”,以垂直大模型推动“人工智能+工程设计”深度融合
- 技术创新赋能千行万业 昇腾人工智能伙伴峰会2026圆满举办
- AI+ Power 2026 香港科技博览黄金展位火热预定中,解锁人工智能及科技的出海机遇
- 芯盾时代创始人孙悦荣获“2025年度吴文俊人工智能科学技术奖”科技进步一等奖
- 受人工智能需求影响,英特尔消费级CPU产品或面临大规模涨价
- 北京人工智能产业联盟AI智能体专委会正式成立 共筑智能体产业协同创新生态
- 量子科技里程碑式跨越,微美全息深化“人工智能+量子”战略突破开启新局
- 攻坚数据智能核心技术 中国移动项目获国内人工智能领域最高奖
- 学而思“AI未来星・2026青少年人工智能科普活动”在京启动









