讯飞星火深度推理大模型X1升级版来了!数学能力和DeepSeek R1谁强
2025-03-08 09:19:57AI云资讯12228
3 月 3 日,科大讯飞发布了深度推理大模型星火 X1(以下简称星火 X1) 再升级,在模型参数量比业界同行少一个数量级的情况下,数学能力全面对标 DeepSeek R1 和 OpenAIo1,在中文数学各项任务中均实现领先,同时联合华为重磅升级星火一体机,融合讯飞星火与 DeepSeek 双引擎能力。
同样是国内当前最强,也是最受关注的两款深度推理大模型,星火 X1 和 DeepSeek R1 的数学能力究竟谁强谁弱? 今天我们做一个简单 PK。试题类型包括初、高应用题、推理题及奥数等,共 5 题,每题 20 分,满分 100,最后以得分多者为胜。
这里之所以没有将深度推理大模型引以自豪的类人思考过程纳入计分项,是因为深度大模型是否正确思考,将直接影响答题结果,无需画蛇添足,再单评测。
题目 1:假设有一个池塘,里面有无穷多的水。现有 2 个空水壶,容积分别为 5 升和 6 升。如何只用这 2 个水壶从池塘里取得 3 升的水。
星火 X1 给出的答案:

DeepSeek 给出的答案:

两大模型都给出了正确答案,但相比之下,讯飞星火的解题步骤更简单、明了,易于理解。该题两大模型均得 20 分。
题目 2:某服装店的老板在武汉看中一种夏季衬衫,就用 8000 元购进若干件,以每件 58 元的价格出售,很快售完,又用了 17600 元同样衬衫,数量是第一次的 2 倍,每件进价比第一次多了 4 元,服装店仍然按每件 58 元出售全部售完,问该服装店这笔生意的盈利情况如何?
星火 X1 给出的答案:

DeepSeek 给出的答案:

两大模型再次全体答对,各得 20 分。
题目 3:

星火 X1 给出的答案:

DeepSeek 给出的答案:

该题牵涉到图形、函数等,手工输入困难,因此我们采用了拍照上传,让两大模型识图解答的方式,令人欣慰的是两大模型都支持识图解题,并且识别结果相当准确,这对于用户来说无疑是一大福音,毕竟对于数学来说,据图解题是常态。
答案方面,两大模型再次不负众望,都给出了正确答案,各得 20 分。相较之下,星火 X1 的解题过程再次表现出了逻辑清晰、易于理解的特点。
题目 5:有 100 根火柴,甲、乙两人轮流取火柴,规定每次取的根数不得超过 10 根,也不能不取。规定谁取到最后一根火柴谁就获胜。如果两人都采用最佳方法,甲先取,那么谁将获得胜利?
星火 X1 给出的答案:

DeepSeek 给出的答案

对于这道典型的奥数问题,两大模型均准确找出了破题点,并给出了准确答案,各得 20 分。
小结:
从以上简单测试来看,讯飞星火深度推理大模型 X1 升级版和 DeepSeek R1 的数学能力都令人叹服,二者表现旗鼓相当,均以满分交卷。只是从解题过程看,星火 X1 给出的要更简洁、更明晰。
和过去人们熟知的大语言模型相比,深度推理模型的最大特点是强化了模型在逻辑推理、因果推断以及结构化知识应用方面的能力,尤其在数学问题、代码生成以及科学推理等方面更具优势。
星火 X1 能类人思考,在生成回答时更强调逻辑和推理,并能给出缜密清晰的思考路径,自动纠错,大大地减少了过去大模型「已读乱回」的现象,可广泛的用于教育、医疗乃至科研等领域。
正是基于深度推理大模型的这一特点, 科大讯飞在发布讯飞星火深度推理大模型 X1 升级版的同时,首发星火医疗大模型 X1,并推出医疗、高教、政务、警务、法律五大全新应用场景一体机,同时正式发布「星火 X1+DeepSeek」双引擎 AI 学习机,进一步赋能医疗、教育、智慧城市等领域。
相关文章
- 科大讯飞与金光集团签约战略合作,携手推动印尼人工智能转型
- MWC 2026 | 科大讯飞全球首发AI眼镜,多款AI产品全新升级
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 科大讯飞AI学习机T90系列重磅发布,开启个性化学习新时代
- 科大讯飞携手天津河西区:探路“人民城市”数字底座,为基层减负增效
- 科大讯飞ANYPIN获2026德国iF设计奖,以隐形科技重塑AI录音新体验
- 科大讯飞将亮相MWC2026,推动安全、可部署AI走向全球行业
- 讯飞输入法行业首发“光标搭子” 深化个性化交互体验
- 讯飞AI录音笔Pokee,同声转译外教讲授实时双语呈现
- 讯飞输入法获NextWorld2025年度风采奖 登陆纽约时代广场
- 生成式AI再进化:讯飞智文为PPT注入“演讲力”,实现内容到表达的跨越
- 讯飞输入法荣登雷科技年度灯塔产品榜人工智能榜
- 工信部人形机器人与具身智能标准化技术委员会成立,科大讯飞担任委员单位
- 电子纸大屏性能持续进化:科大讯飞携手元太科技发布13.3英寸智能办公本MAX2
- 科大讯飞河南人工智能产业生态基地正式启动,共话郑州港区人工智能新未来
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









