北大杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
2025-05-26 10:56:20AI云资讯1798
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实现与更大模型相当甚至更优性能的可能性。该研究得到了国家自然科学基金委项目(624B2005,62372009)的资助。FairyR1-32B模型已在huggingface开源:https://huggingface.co/PKU-DS-LAB/FairyR1-32B。
FairyR1-32B模型是在团队前期TinyR1工作基础上进行的进一步探索,沿用了“分合蒸馏”的研究思路,提出了多种改进方法,包括自我合并、多教师交叉蒸馏、轻蒸馏等方法,并在数据处理进行了优化,模型精度有了显著提升。
本次工作重点改进了蒸馏数据的构建流程,对来源于AI-MO/NuminaMath-1.5(数学)和open-thoughts/OpenThoughts-114k(代码)等数据集的原始数据,通过多个“教师模型”生成答案,随后对问答数据进行精心筛选、结构调整与思维链优化,并进行多阶段筛选。筛选过程包括基于答案的正确性验证(针对数学数据),以及基于长度的筛选(数学数据保留2k-8k tokens范围,代码数据保留4k-8k tokens范围),最终构建了更具针对性的约6.6k条数学数据和约3.8k条代码数据用于训练。
在模型结构方面,研究团队尝试训练两个领域(数学和代码)的专业模型进行合并,旨在进一步优化流程和资源消耗。这两个专业模型在一致的训练参数下(例如相同的学习率和批次大小)独立训练约5个周期后,利用AcreeFusion工具进行了合并。在多个公开基准测试中,FairyR1展现出了在低参数量下的竞争力表现。以下为FairyR1与DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基准上的得分对比:

从测试结果可以看出,FairyR1-32B在AIME 2025和LiveCodeBench基准上得分略高于DeepSeek-R1-671B,在AIME 2024上表现接近。在GPQA-Diamond科学基准上,FairyR1的得分低于DeepSeek-R1-671B。这些结果表明,FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并经过特定技术处理后,能够在约5%参数量的情况下,在数理和编程等领域实现与大型模型相当或略优的性能水平,但在科学等其他领域可能存在差距。这项工作探索了通过优化的数据处理和模型融合技术,在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。
北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”
团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝

相关文章
- 告别手搓代码:移远AIDE一键部署,端侧AI落地快人一步
- 华为云码道(CodeArts)代码智能体公测版正式发布,开启智能体编码新实践
- 勤哲Excel服务器:企业级零代码开发平台全球引领者
- 熊谱翔与RT-Thread睿赛德的廿载进化论:从代码开源到生态共赢再到生产力革命
- 沉浸新视界,代码皆非凡|明基编程显示器旗舰款RD280UG上市
- 零代码游戏创作平台,极逸SOON AI让2人48小时轻松做出爆款游戏!
- 国内首家CRM平台商神州云动荣誉入选「2025年度低代码企业TOP50」
- TRAE CN企业版正式发布,支持10万文件、1.5亿行代码超大仓库索引
- 低代码驱动LTC全流程贯通,蓝凌智能CRM助力半导体企业数智突围
- 声网对话式 AI Studio 零代码也能快速开发对话式 Agent
- 从代码生成到智能开发:北大发布基于昇腾平台软件开发解决方案
- 智元推出“灵创”平台:0代码创作,人形机器人内容生态迎来新变革
- 开源鸿蒙“校园合伙人”:以青春代码,共筑数字中国新基座
- 传统软件工程的黄昏与数睿数据AI无代码的破晓
- 无代码平台是什么?勤哲Excel服务器值得推荐
- 工业富联AI低代码平台入选浙江省人工智能赋能制造业典型案例
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









