千锤百炼 九天大模型是怎样炼成的?
2024-06-03 17:15:16AI云资讯3962

“九天”人工智能基座的神秘面纱在数字中国建设峰会中国移动人工智能大会上被揭开,“九天”不仅是一个技术创新的里程碑,更是助推经济社会高质量发展的强大引擎,由万卡级智算集群铸就坚实根基,千亿多模态大模型构建丰富内涵,汇聚百大要素的生态平台成就了其广阔视野与无限可能,为数字经济的蓬勃发展注入了强大动力。
“九天”亮剑,实现跨越式发展
“可上九天揽月,可下五洋捉鳖”。中国移动始终与国家的发展脉搏同频共振,自2013年起便踏上了与人工智能深度融合的探索之路,打造了全力投身人工智能技术创新和产品研发的“九天”团队,致力于将人工智能技术融入其核心业务,推动行业的智能化发展。

中国移动“九天”团队从智能客服领域入手,助力10086客服成为全球交互量最大的智能客服系统;又在大数据智能领域深入攻关,助力多个省公司显著提升了营销效益。
为进一步加快人工智能的广泛创新,中国移动2017年正式上线了“九天”人工智能平台。
该平台是国内首个运营商自主研发的人工智能平台,可助力人工智能开发者们充分利用中国移动在算力、数据等技术资源的规模化优势而敏捷、高效地实现丰富多样的人工智能算法、应用,并加速这些成果在中国移动丰富的应用场景中得到落地。
“面向通用人工智能的‘人工智能大平台’,其能力底座是大模型。”九天基础大模型研发负责人表示,AI给整个行业带来了革命性的变化,所有从事这个行业的人都会非常期待。“我相信智能化会深入到生产生活、社会治理、科学研究等方方面面,我相信它一定会让我们整个文明上升一个台阶。”
拾级而上,攻坚难题锻长板
随着科技的飞速发展,人工智能已成为引领数字化转型的重要力量。2023年3月,中国移动成立大模型研发团队,攻关通用人工智能技术,抢占科技制高点。

大模型的训推技术是一个新的方向,在全球任何一家公司都是核心机密,公开的学术论文只能窥看到冰山之一角,但这些已经是研发团队获取训练技术的最佳途径。
在九天基础大模型研发工作中,研究人员很多时候要摸着石头过河,甚至要勇闯技术“无人区”,日夜不辍地提炼技术要点,为大模型攻关积累了知识底座,结合训练过程,形成了完整的训练日志,成为了大模型攻关过程中最宝贵的知识财富。
“众人拾柴火焰高”,没有现成标准可遵循、没有成熟经验可借鉴,在这种情况下,研发团队在多方渠道收集了近500万亿字符的原始文本数据,其规模近乎覆盖了人类有史以来全量的文本类知识。他们对这些数据进行一轮又一轮的精洗和去重,优选的比例是100:1,打造出近5万亿字符的高质量训练数据集,为大模型训练奠定了数据基础。
最开始的半年时间里,算力不足、平台的断点续训功能也未开发完成,研发团队24小时日夜监控千卡集群的训练状态,第一时间处理故障、恢复训练任务。但因为对模型的超参数设置把握火候不够,训练一次次归零,一次次从头再来。在挫折面前,他们展现出极强的韧性和抗压能力,坚守一线,直到模型最终收敛出完美的曲线。
新技术要敢于在实际的生产中锤炼。在大模型训练过程中,对于高性能算力资源面临着严重的“卡脖子”问题,相应的框架、加速技术等也难以直接使用,亟需实现全链路高度自主可控的大模型训练。

现在九天语言大模型已实现在近万卡集群上进行训练,速度达130T Flops,无故障训练时长在同等规模芯片训练中达到国际领先水平,已与中石油、中航信、中化等央企建立合作,加速产业赋能。
积力所举,则无不胜;众智所为,则无不成。中国移动将与产业一道,不断建强“九天”人工智能基座,立足于在重点领域形成创新突破,推进AI在通信服务领域的创新发展及落地应用,带动我国大模型产业生态融通共赢。
相关文章
- 携手共建“物理世界大模型”联合实验室,洞察时空与上海电信达成战略合作
- 东软添翼医疗大模型领跑 医疗AI进入“可信时代”
- 直接上智能体,还需要统一基座大模型吗?医院智能化走到十字路口
- 云知声 U2-ASR 2.5上线:首个中文方言语义转写大模型
- 全国首个内容审核大模型过审 云从科技破解Agent时代谣言难题
- 湖北移动AI实验室让中小企业零门槛用上大模型
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 荆华密算入选主流价值语料生态联盟首批成员,护航大模型时代,为AI系上“安全带”
- 稳居第一梯队!东软添翼医疗大模型用实力回应“医疗AI”
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 唯一聚焦制造业!创新奇智入围IDC大模型私有化市场前五
- 可视、可管、可算、可追溯!浩鲸科技重磅推出鲸智大模型Token运营平台
- 数字峰会探新“智”| 数字中国AI竞速:大模型从“能力竞赛”转向“可信落地”
- 数字峰会探新“智”|为AI装上“质检员”,浪潮软件集团发布大模型“体检”方案
- AI大模型智能体独角兽再落子!探迹科技完成真爱美家收购交割,持股达 43%
- 北京亦庄设立大模型生态服务站 助力AI产业合规发展
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









