“九天”通用基础大模型3.0发布 模型能力多维升级 多项技术成果开源
2025-07-26 21:57:37AI云资讯2389
7月26日,在2025世界人工智能大会“AI焕新 产业共赢”企业人工智能产业发展论坛上,中国移动焕新发布“九天”基础大模型3.0,向业界展现了中国移动在大模型领域的深厚自研能力和持续创新能力。
本次发布的“九天”基础大模型3.0是国务院国资委战新“百大工程”的重要成果,进一步强化了“高安全、高可控、全国产、全行业”四大特性,重点实现三大焕新:
一、九天众擎语言大模型实现架构与性能双重跃迁。模型突破性采用可扩展至万亿级的MoE架构,以15T token多阶段配比预训练数据与全流程治理体系强化推理能力,创新构建113域×53能力的二维分级后训练框架,结合动态强化学习策略,驱动复杂推理能力提升35%。模型权威在榜单成绩斐然。在GPQA-Diamond评测中,“九天”以77.67分斩获全球第二,超越DeepSeekR1和Qwen3;在ArenaHard V1.0中,以67.2分位居全球第一;在BFCL V3评测中,达到68分。性能跃升的同时,模型进一步强化了可控生成能力,破解沉浸式角色演绎,精确流程内置等技术细节,实现了专业场景零幻觉。
基于最新的语言大模型,中国移动此次也推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。指标方面,在EvalPlus、MHPP、LivecodeBenchv6等多个代码生成榜单上成绩领先。九天数学大模型,短思考、长思考模式均达到业界SOTA水平,多项指标超过Qwen 2.5 Math、Qwen3、DeepSeek Math、DeepSeek R1-Distill等同参数量级模型。
二、九天善智多模态大模型全面提升生成可控性与理解能力。模型基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。例如,在图片生成功能方面可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。模型在图理解和视频理解方面的性能表现也全面提升。图理解方面,在MMStar、HallusionBench和OCRBench等图理解任务中,九天模型分别获得了82.2、64.3和94.9的高分,处于业界领先水平;视频理解方面,九天模型在Videomme和MVbench两个任务中均表现领先超过Qwen2-VL和InternVideo2。
三、模型及核心技术开源。一是开源九天数童结构化数据大模型,开源内容包括JT-DA-8B模型及后续演进版本,支持下载模型权重、微调代码、推理代码等;二是开源九天数学大模型,开源内容包括JT-Math-8B 系列模型,支持下载模型权重、推理代码、技术报告;三是开源九天代码大模型,开源内容包括JT-Coder-8B 系列模型,支持下载模型权重、推理代码、技术报告。四是开源业界首创的结构化数据模型评测数据及TReB评测体系,测评体系涵盖6大任务、34个能力,包括了高质量且全面的数据、推理模式及评价指标,支持下载评测数据集、测试代码;五是开源CCR-Bench行业场景复杂指令遵循评测数据集,该数据集涵盖174条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。以上内容已上线焕新社区、Github、HuggingFace、魔搭社区、Gitee、Arxiv。
中国移动九天人工智能研究院已计划8月推出此次发布内容的技术深度解读,将通过“九天人工智能”视频号等渠道视频直播,敬请业界关注。
相关文章
- Soul全双工语音大模型升级 迭代人机交互体验感
- 模型选型专题系列 | 业界首个!元景MaaS平台上线《大模型选型说明书》
- 获央视点赞 深兰科技AI医疗大模型落地打浦桥街道社区服务中心
- 新达内与百度智能云达成战略合作 联合培养人工智能大模型人才
- 斑马AI大模型:为每个孩子提供专属学习方案
- 打造广东首个地方文献专题处理AI大模型,南沙区图书馆“阿贝数字人”项目重磅上线!
- 商汤大装置跻身中国大模型平台市场头部厂商,万象平台加速AI落地“最后一公里”
- DFRobot 亮相贸泽电子 elexcon 2025 展台,展示与Qwen3 大模型融合的AI 应用
- 旷视赵康:做大模型的“炼金术士”,让AI在千行百业中兑现价值
- 云轴科技ZStack入选IDC大模型推理算力市场报告典型厂商
- 中国具身大模型初创公司眸深智能获得IJCAI2025杰出论文奖,唯一获奖大陆团队!
- 心率血氧监测新玩法:行空板M10融合AI大模型,让数据会“说话”
- 特斯拉在中国市场放弃xAI的Grok大模型 选择接入DeepSeek AI技术
- 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%
- 聚焦制造业智能化转型 中国科学技术大学依托昇腾突破知识增强大模型关键技术
- 大模型推理成本居高不下,浪潮存储帮你来突围!
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>人工智能产业
更多>>- 昆明市2025年职工职业技能竞赛无人机赛项在飞虎实训基地精彩启幕
- 深之蓝参与编制的国家标准——《淡水水下搜救机器人通用技术条件》获批发布
- 极客邦科技霍太稳荣膺 “中国企业培训行业 20 年特别贡献人物”:以 AI 人才培养破局企业数智化转型
- 模型选型专题系列 | 业界首个!元景MaaS平台上线《大模型选型说明书》
- 模型选型专题系列 | “一句话选模型”智能体,助你告别模型选型困境
- 吴文俊:以数学机械化照亮AI之路,精神薪火照亮创新征程
- 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州
- 超千家AI企业“智汇”鹏城 2025 AGIC深圳(国际)通用人工智能大会暨产业博览会启幕