性能提升30%!中国电信进一步开源12B星辰大模型
2024-04-16 21:31:15爱云资讯767
近日中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高质量发展。另据悉,中国电信将于年内开源千亿级参数大模型。
中国电信人工智能研究院(TeleAI)坚持完全自研自主可控,在中国电信首席技术官、人工智能首席科学家、TeleAI院长李学龙带领下,加快研发创新,不断优化底层模型结构,解除Word Embedding与lmhead共享参数,有效提升模型稳定性和训练效果,并基于精细化的CheckPoint效果验证,进行动态的数据配比优化调整,大幅提升模型训练效果。
海量高质量数据是保证大模型效果的基础,TeleChat-12B将7B版本1.5T训练数据提升至3T,优化数据清洗、标注策略,持续构建专项任务SFT(监督微调)数据,优化数据构建规范,大大提升数据质量;同时,基于电信星辰大模型用户真实回流数据,优化奖励模型和强化学习模型,有效提升模型问答效果。
TeleAI通过更彻底地开源推动大模型技术进步和大模型国产化进程。此次开源提供基础模型以及基于相应版本的对话模型、不仅支持传统的全量参数更新还支持 LoRA 等只更新部分参数的高效微调方法、支持Deepspeed微调、支持int8、int4量化和国产芯片训练推理,推动大模型国产化进程。
加速探索创新的同时,星辰大模型也在深入推动人工智能与各行各业的融合,积极探索新兴的应用场景。星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景,以行文写作为例,其平均生成字数超过1500字,有效采纳率达到85.7%;在对外企事业单位客户的业务中,星辰语义大模型支持企业经营分析、政务公开咨询、民生诉求接待等场景,可覆盖95%的实际业务场景,多轮理解准确率达到90%。除传统行业应用场景,星辰大模型积极探索前沿领域应用,赋能具身智能,解决无人机编排投入多、开发量大的问题,实现无人机智能编排轻量化建设。
据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。客服大模型在全国试点上线18个服务场景,充分赋能智慧客服和数字人,在激活十亿级的日志、百亿级的网络参数等海量数据资产的基础上,进一步深化智能化运营;星辰政务大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;星辰经分大模型已落地某市经信局行业大模型,利用大模型生成能力快速草拟相关产业研究报告,简化知识检索流程,快速、精准查询所需知识内容,以便迅速、准确地掌握发展动态,支持决策过程,并追踪全球经济形势和科技创新,满足迫切的产业洞察和分析需求。
相关文章
- 顶尖大模型厂商齐聚2025 TUYA全球开发者大会,共探AI如何重塑行业生态
- 海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
- 大模型用于招采评审,这样解决“AI幻觉”问题!
- AUDI携手Momenta联合打造行业首个 “德系电动豪华标准+飞轮大模型” 智能辅助驾驶方案
- 华为开发者大会 2025 发布邀请函,盘古大模型、昇腾AI云服务新进展即将公布
- 凯迪拉克VISTIQ亚洲首秀,搭载Momenta飞轮大模型定义豪华纯电智能出行
- 大模型赋能智慧交通,宇视携30+创新产品方案亮相武汉交博会
- 2025上海车展 | 讯飞星火大模型“朋友圈”持续扩大,智能座舱、智慧声场引领汽车交互新体验
- 腾讯智慧出行技术开放日:升级全栈AI能力,助力汽车产业大模型应用
- 罗盘大模型应用开发平台Compass Copilot助力企业快速搭建大模型应用
- 全国首个“AI大模型+智能体”智能查号系统,亚信科技携手天津联通打造
- 腾讯云李力:构建稳定安全的基础设施,助力大模型应用落地
- 中国电子商会大模型应用产业专业委员会正式成立 构建大模型落地“最后一公里“枢纽
- UU跑腿全面接入MCP大模型上下文协议 开启智能服务生态新纪元
- 腾讯云大模型知识引擎已率先接入MCP!拓展AI应用边界
- 腾讯云王麒:大模型+知识库,是企业落地AI的最佳路径