中国电信开源12B星辰大模型,携手昇腾推进大模型全栈国产化进程
2024-04-18 14:51:57AI云资讯14088
中国电信消息,近日中国电信人工智能研究院开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高质量发展。另据悉,中国电信将于年内开源千亿级参数大模型。
中国电信人工智能研究院(TeleAI)坚持完全自研自主可控,在中国电信首席技术官、首席科学家、TeleAI院长李学龙带领下,加快研发创新,不断优化底层模型结构,解除WordEmbedding与lmhead共享参数,有效提升模型稳定性和训练效果,并基于精细化的CheckPoint效果验证,进行动态的数据配比优化调整,大幅提升模型训练效果。
海量高质量数据是保证大模型效果的基础,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。
TeleAI通过更彻底地开源推动大模型技术进步,同时携手华为昇腾,推动大模型全栈国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持LoRA等只更新部分参数的高效微调方法、支持Deepspeed微调、支持int8、int4量化。
在推动大模型全栈国产化进程上,TeleChat-12B已支持昇腾AI基础软硬件:推理方面,支持Atlas300IDUO推理卡,精度与性能表现均与业界第一梯队持平。已规划支持Atlas800IA2推理服务器;训练方面,支持昇腾训练服务器,用户可使用昇思MindSpore和PyTorch框架进行多机多卡模型训练和微调,两个框架下模型精度与性能均有不俗表现。当前在多个项目中,已基于昇腾技术完成模型商用落地。下一步规划基于天翼云昇腾智算集群,训练多种尺寸的TeleChat模型,以AI赋能千行百业。随着电信与华为昇腾合作的不断深入,电信已经培养出一支成熟的昇腾开发者团队,为人工智能技术自主可控贡献专家力量。

加速探索创新的同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景,以行文写作为例,其平均生成字数超过1500字,有效采纳率达到85.7%;在对外企事业单位客户的业务中,星辰语义大模型支持企业经营分析、政务公开咨询、民生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型积极探索前沿领域应用,赋能具身智能,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。
据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。客服大模型在全国试点上线18个服务场景,充分赋能智慧客服和数字人,在激活十亿级的日志、百亿级的网络参数等海量数据资产的基础上,进一步深化智能化运营;星辰政务大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;星辰经分大模型已落地某市经信局行业大模型,利用大模型生成能力快速草拟相关产业研究报告,简化知识检索流程,快速、精准查询所需知识内容,以便迅速、准确地掌握发展动态,支持决策过程,并追踪全球经济形势和科技创新,满足迫切的产业洞察和分析需求。
相关文章
- 智云重庆 智惠山城 中国电信第六届科技节·重庆站启幕
- 中国电信集团市场部副总经理章峻青:全力推进宽带提质升级,为亿万家庭筑牢网络底座
- 浩鲸科技亮相数字中国建设峰会,携手中国电信以AI-Native驱动云网智能化
- 华为携手中国电信共建网优数字员工,共创智能运营新范式
- 中国电信柯瑞文:Token经营的本质 就是为用户提供AI服务
- 强强联手 共启文创新篇|中动联合携手中国电信,打造 Disney AI/XR 文创标杆项目
- 中国电信eSIM手机阵容再升级,累计支持机型达11款
- 艾灵、施耐德电气、中国电信联合打造全球首个工业蜂窝网工厂
- 中国电信2025年营收为5296亿元 净利332亿元
- 让“龙虾”安全上岗!中国电信发布天翼智安·智能体安全解决方案
- 中国电信eSIM支持三星S26全系手机,3月6日正式开售
- MWC2026 | 中国电信发布低空经济能力体系
- 中国电信揽获多项GLOMO大奖,科技创新成果获广泛认可
- 中国电信AI原生云网体系引领全球通信业智能化转型
- 中国电信总经理刘桂清:从连接到智能 云网宽带发展进入新时代
- 中国电信大上行重磅亮相,赋能AI与无线网络新生态
人工智能企业
更多>>人工智能硬件
更多>>- 一飞智控携全空间解决方案及三款新品,亮相2026世界无人机大会
- 续航超强的微星全新尊爵系列,重塑轻薄本的超凡全能体验
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- Neousys宸曜发布星宸系列强固嵌入式工控机,赋能工业智能升级
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









