中国电信星辰语义大模型正式开源,携手昇腾共建开源大模型生态
2024-01-12 18:55:36爱云资讯阅读量:19170
1月10日,中国电信星辰语义大模型TeleChat-7B版本宣布开源,并开放1T高质量清洗数据集。星辰语义大模型已与昇腾AI基础软硬件完成适配,并开源了适配后的代码。此外,中国电信还将在1月20日开源12B版本模型,拥抱更多开发者共建开源大模型生态。
星辰语义大模型是由中电信人工智能科技有限公司研发训练的大语言模型,采用1.5万亿 Tokens中英文高质量语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将AI大模型的幻觉率降低了40%,这有助于大模型变得更有“人味”,真正理解问题语境,告别风马牛不相及的答案。
目前,星辰语义大模型正在与千行百业的信息化解决方案进行融合,满足多样场景需求。在中国电信内部,星辰语义大模型赋能行文写作、代码编程、网络故障分析以及经营分析等场景,以行文写作为例,其平均生成字数超过1500字,有效采纳率达到85.7%;在对外企事业单位客户的业务中,星辰语义大模型赋能企业经营分析、政务公开咨询、民生诉求接待等场景,其业务覆盖率达到95%,多轮理解准确率达到90%。
早在2023年11月,中国电信就在2023数字科技生态大会上发布了千亿参数“星辰语义大模型”,并公布了后续的开源开放的时间表。本次TeleChat-7B版本开源了对话模型TeleChat-7B-bot,以及其huggingface格式的权重文件。此外,还开源了7B模型的int8和int4量化版本。
可访问开源仓了解详情:
Gitee地址:https://gitee.com/Tele-AI/tele-chat
Github地址:https://github.com/Tele-AI/Telechat
在模型开发上,星辰语义大模型已与昇腾AI基础软硬件完成适配:支持Atlas 300I pro推理卡,具备int8量化能力,精度与性能表现均与业界第一梯队持平;支持Atlas训练服务器,用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理,两个框架下模型精度与性能均有不俗表现。
除了星辰语义大模型,目前已有50+业界主流大模型基于昇腾训练迭代,9家伙伴携手昇腾发布了大模型训推一体机,昇腾以开放易用的平台使能千模百态,为大模型创新注入动能。
本次星辰语义大模型TeleChat-7B版本开源,夯实了中国电信构建开放生态的重要一环,降低了大模型开发门槛,未来,中国电信将进一步携手昇腾AI等合作伙伴推动中国大模型在千行百业落地,加速人工智能产业发展。
- 神州问学上架Llama 3.1开源大模型,构建多元大模型生态体系
- 豆包大模型日均tokens使用量超5,000亿,火山引擎全栈AI服务升级助企业加速AI转型
- 元脑伙伴共行记丨华胜天成:大模型应用落地 技术行业优势需互补
- 上汽乘用车携手豆包大模型,有效提升“用户之声”的反馈处理效率
- 零成本切换、手把手指导!百度智能云“故乡的云 · 大模型平台迁移课程”上线
- DataCanvas Alaya九章元识大模型通过北京市生成式人工智能服务备案
- 依图科技多模态大模型伙伴CTO精研班一期圆满举办,共同迈进大模型新时代
- OpenAI“草莓”大模型新项目曝光,微美全息探航AI风口加快落地应用
- 2024百度健康产业生态大会:大模型重构健康生态
- 北京筑龙大模型落地应用方法论,打造采购供应链数智化新引擎
- 瓴知TMA-4.1版本 基于大模型与威胁建模的最佳实践,重磅发布!
- 科沃斯机器人大模型算法通过备案,AI大模型与智能清洁结合带来哪些超级体验?
- 容联云在WAIC 2024发布容犀大模型应用,重塑企业“营销服”!
- 快手大模型首次集体亮相WAIC 2024,用AI重塑内容与商业生态
- WAIC 2024海飞科GPU算力卡:单卡运行千亿参数AI大模型的先锋
- 科大讯飞牵头编写,国内首个银行业大模型标准发布