破解 AI “安全与性能” 难题!DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布
2025-09-19 09:38:23AI云资讯2419
9 月 18 日,华为全联接大会 2025 在上海盛大开幕。会上,华为技术有限公司与浙江大学联合发布了国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。在中国工程院院士陈纯、华为昇腾计算业务总裁张迪煊的见证下,浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎携手华为公司Fellow、计算架构与设计部部长蒋铭共同完成DeepSeek-R1-Safe基础大模型发布仪式。出席仪式现场的还有浙江大学网络空间安全学院副院长秦湛、华为计算技术开发部部长杨宝川和计算高校科研与人才生态发展部部长崔玫芳,同时多位浙江大学“百人计划”研究员出席活动。

(发布仪式)
陈纯院士对DeepSeek-R1-Safe基础大模型发布表示祝贺,感谢华为长期支持。他指出,浙江大学计算机学院已组建起一支涵盖多位海内外优秀青年人才的科研团队,并已成功依托昇腾生态,实现了自主全流程后训练框架,完成了国内首次千卡集群大模型安全训练。这次DeepSeek-R1-Safe的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。他表示希望团队未来与华为展开更深入合作,共同推动我国 AI 技术进步。

中国工程院院士 陈纯
张迪煊表示,自2019年以来,华为在应对外部环境变化的过程中持续加大研发投入,突破多项关键核心技术,在硬件与产业生态建设方面取得了一系列成果。在华为全联接大会2025上,华为也正式推出了昇腾新一代AI硬件与全系列软件开源开放战略,覆盖编译器、运行时驱动等核心组件,致力于通过深度开放协作,联合高校与产业伙伴共同推动基础软件创新与AI安全能力建设。他强调,华为坚信,与浙江大学的紧密合作将有助于进一步增强源头创新能力,共同筑牢安全、可信、有竞争力的AI产业生态,为我国人工智能的高质量发展保驾护航。

华为昇腾计算业务总裁 张迪煊
随后,任奎详细介绍了DeepSeek-R1-Safe-671B基础大模型的核心创新。研发团队从底层入手,构建了一套覆盖“高质量安全语料—平衡优化的安全训练—全链路自主创新软硬件平台”的全流程安全后训练框架。在算力平台搭建方面,团队首次实现基于昇腾千卡算力平台的千亿级参数满血版大模型安全训练,系统性地解决了训练环境中的关键问题,构建了服务器间环境依赖同步、数据与权重共享、协同训练推理等一系列开发工具。目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多个社区全面开源。测试结果表明,DeepSeek-R1-Safe针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题整体防御成功率近100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%。其综合安全防御能力达83%,在同样测试设置下超过Qwen-235B和DeepSeek-R1-671B等多个同期模型8%至15%。此外,在MMLU、GSM8K、CEVAL等通用能力基准测试中,DeepSeek-R1-Safe相比于DeepSeek-R1的性能损耗在1% 以内。这些结果表明 DeepSeek-R1-Safe不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。

浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎
随后的交流讨论中,全场与会嘉宾围绕“AI安全治理框架构建”“自主创新生态开发者培育”“校企协同创新机制优化”等话题展开深入探讨,一致认为该成果为我国突破AI安全技术壁垒、构建自主的智能生态提供了重要支撑。
据悉,浙江大学鲲鹏昇腾科教创新卓越中心自成立以来,始终聚焦“人才培养、系统架构创新和赋能交叉学科”三大核心任务,通过算力资助及专家支持,举办特训营、研讨会和专业竞赛,已形成“产教融合、科教融汇”的创新模式。此次DeepSeek-R1-Safe基础大模型的发布,正是卓越中心模式下的重要成果。未来,双方将继续深化合作,在多模态安全模型研发、AI安全测评标准制定等领域持续攻关,为我国人工智能高质量发展提供坚实基础。
相关文章
- 从精准评估到智慧辅学:宝盛鑫以轻量级大模型引领AI司法教育新赛道
- 显示龙头卡莱特完成DeepSeek V4在昇腾平台验证,国产大模型工程化落地提速
- 奇瑞汽车与火山引擎达成战略合作 豆包大模型将接入“小奇同学”
- 又一量产车型落地!奔驰纯电 GLC 全面接入豆包大模型
- 宇视科技亮相南京交博会,梧桐大模型凭实力“圈粉”
- 腾讯云与阶跃星辰达成战略合作,共塑大模型时代智能座舱新体验
- 亮相南京交博会,宇视梧桐大模型凭实力“圈粉”
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Testin XAgent拆解:大模型+多智能体如何重构测试自动化工程
- 垂直大模型技术创新的“专业燃料”:为什么知识产权高质量数据集不可或缺?
- 交付结果而非工具:零犀科技如何用因果大模型打破AI商业化僵局,实现规模盈利
- 又一金融信创标杆!神州鲲泰入围中信银行CANN生态信创大模型服务器项目
- 物理AI领航者江行智能:“空间智能大模型”让AI真正看懂工业现场
- 海康威视徐习明:聚焦感知多模态大模型,为中国制造业发展服务
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









