深信服AICP算力平台在2024数字中国创新大赛两个赛道获奖
2024-05-29 10:25:40AI云资讯18544
在近日圆满举办的2024数字中国创新大赛中,深信服AICP算力平台获得2个奖项!
《基于私有化大模型的推理训练一体化 Al算力平台》
2024数字中国创新大赛·信创赛道 行业贡献奖
2024数字中国创新大赛·城市赛道 二等奖
在垂直领域拥有自己的私有化大模型,已逐渐成为业界共识,但研发门槛高、使用成本高、安全风险高等痛点正在阻碍大模型落地的效率。深信服于今年3月份正式发布AICP算力平台,面向各行各业大模型开发部署场景,提供一站式大模型训练和推理能力,为用户提供向导化配置、一键训练;一半成本、五倍性能;模型加密、保护知识产权的业务价值。
深信服AICP算力平台解决方案
打造“让更多用户用得上的AI”,是深信服AICP算力平台的产品愿景。借由本次获奖的机会,深信服AICP算力平台展现其最新能力:
一、向导化配置,一键训练
深信服AICP算力平台能够管理异构算力GPU资源池,并内置了主流的开源基模型、丰富的开源数据集,包括中英文语料库,以及医疗、金融、教育、法律等垂直领域的开源数据等,可帮助用户简化训练准备过程。
用户通过三步向导式操作,选择基模型、选择数据配比、选择算力资源池,即可一键开启训练任务,无需自行配置100多项复杂的超参数。
同时,通过三大关键指标监控和处置,使模型训练过程一目了然,可有效保障训练稳定、高效训练出垂直大模型。
1、实时资源监控:实时监控GPU、CPU、内存、存储指标,及时调整,防止训练中断。
2、Checkpoint管理:本地SSD中保存最新模型状态,即便训练中断也可快速恢复。
3、Loss曲线可视:曲线震荡或者上升及时调整训练数据;曲线下降并趋于稳定,表示训练效果良好。
二、一半成本,五倍性能
针对使用成本高,平台内置大量训练和推理优化技术,创新地提供基于业务感知量化(BAQ)能力,在不损失大模型在垂直领域效果的同时,让推理性价比得到数倍的提升。
1、通过模型量化,使模型显存占用减少50%,需要的GPU数量减少50%。
2、创新的业务感知量化技术BAQ,保证量化后垂直领域业务效果无损。
3、联合CPU和GPU进行通信优化,让系统总吞吐提升超过20%。
4、结合业务数据的注意力稀疏技术,降低显存占用,让推理并发用户数提升30%。
5、对推理缓存进行了混合精度压缩,让系统总吞吐提升超过30%。
三、模型加密,保护知识产权
针对安全风险高的问题,平台内置业界独有的模型动态加密能力,有效保护用户知识产权,防止核心的“模型资产”泄露。
同时,在这些核心技术以外,深信服AICP算力平台还积极推进信创生态构建。
提供对AI技术栈的良好兼容性,通过软硬件联合调优,满足大模型训练、推理任务对算力和性能的要求,让用户在信创环境中也能进行大模型项目的开发和应用,同时满足合规和业务建设需求。
深信服和国内厂商开展了广泛的软硬件兼容测试,如华为昇腾系列NPU、天数智芯全自研通用GPU等等,从测试结果看,在相同硬件成本下,国内厂商推理卡性能表现出色,能够在信创场景实现大模型任务承载。
深信服多年来坚持AI First的研发战略,积极探索先进的AI技术应用,未来将持续以创新能力为用户带来更多智能化、个性化的AI解决方案。
相关文章
- AI智慧存储下一代,极空间NAS算力狂飙全场景进化
- 用铠侠BiCS Flash,为AI算力创造新可能
- 中国移动打造可靠AI算力底座 实现智算集群万卡长稳运行新突破
- 乘智算东风,筑AI算力基石丨科士达模块化数据中心案例图谱
- 信而泰助力中国移动推出全国产400G高端网络测试仪,夯实算力网络基石
- 云天励飞“算力积木”联手OISA,突破万亿级MoE大模型推理集群的Scale up瓶颈
- 中科星云星算平台全国首批代理商签约成功 共建分布式 AI 算力生态
- 懂电力,懂算力,科华数据全栈算力解决方案赋能电力行业数智化转型
- 从聚力向芯到生态共筑:以互联技术助力打造AI算力产业链闭环
- 华为全联接大会2025首发《算力珠玑》十大实战案例助力开发者攻克鲲鹏、昇腾开发难关
- 英特尔助力阿里云推出多款云实例与存储方案,共筑AI时代云端算力基石
- “全光运力·毫秒用算”论坛在京成功举办,《算力网络运载力指数评估报告(2025年)》等三项成果正式发布
- 龙宇数据战略布局,上海云漫易算斩获亿级算力订单
- 智算IP广域网助力首个百公里级算力互联网跨域互联,实现高效与安全、性能与成本的平衡
- 华为张振国:构建绿色算力服务,使能客户建好、维好、用好算力
- 华为云:做厚算力“黑土地“,成就行业AI先锋