基于英特尔®至强®处理器,宝德AIGC解决方案加速释放AI动能
2023-12-28 09:54:23AI云资讯1557
当前,生成式AI和大模型正以燎原之势走进制造、金融、医疗、交通、教育等行业和领域,引发行业更多创新和变革,加速全社会数字化和智能化转型。近日,工信部赛迪研究院发布报告显示,2023年我国生成式人工智能市场规模有望突破10万亿元。作为中国领先的计算产品方案提供商和AI服务器市场TOP3,宝德计算凭借丰富的市场经验和对客户AI需求的深刻洞察,携手英特尔AI软硬件基础技术,匠心打磨和推出了宝德生成式AI解决方案。
一键部署,灵活定制
宝德AIGC解决方案是软硬一体化解决方案,既可以集群部署也可以单机部署,方案架构包含硬件层、平台层、服务层和应用层。在硬件层,宝德充分发挥了20年服务器行业技术积累,提供涵盖AI训练服务器、AI推理服务器和AI边缘产品等多平台选择和可兼容,进行模型的高速训练、微调和高效推理。在硬件基础上,方案采用K8S进行集群资源管理(单机部署采用Docker)。基于雄厚的硬件层和平台层,在服务层部署了ChatGLM大模型推理服务、由GLM微调而来的行业大模型-宝德酒业大模型推理服务、宝德自研的嵌入数据仓库服务,可以将行业数据转换成向量数据,存储到向量数据库中,通过相似度匹配算法查询出相关内容交给大语言模型进行推理、LLM Functions服务,主要让大语言模型拥有调用后端接口的能力。基于这些硬件和服务,宝德开发了诸如聊德宝、AI客服和数字人等多种AI应用,可广泛服务于行业大模型、智能语音助手、网络直播、线上教育和培训等领域。

值得一提的是,宝德深耕行业多年,基于对市场的理解和对客户生成式AI多样性的计算需求,可提供生成式AI解决方案的定制化服务。
性能卓越、成本可控
AIGC快速发展之时,算力越来越紧缺和成本越来越高,逐渐成为影响AIGC发展和落地应用的“绊脚石”。并且,从大模型的发展和应用看,AI推理的规模远高于训练,有效降低推理成本成为宝德的思路。对此,宝德技术团队经过反复测试和调优,精心准备了全部采用英特尔全新的至强处理器(Max系列)平台,以及Intel GPU的AIGC解决方案,使其集强大的AI计算、推理性能和卓越的经济效益于一体,以充分释放AI动能。

第四代英特尔®至强®可扩展处理器MAX系列CPU在大语言模型(LLM)推理方面有独特优势。它有32至56个内核,可提供最高112线程,内置英特尔高级矩阵扩展(AMX)的AI加速功能,可帮助诸如图像识别、对象探测等任务中的张量处理获得多倍效率提升,并可用于INT8、BF16等不同数据格式,性能高达上一代10倍。而且所有MAX处理器都内置了64GB的HBM2e 高带宽内存,分为4个16GB的集群,总内存带宽为1 TB / s,能够解决大模型工作负载经常受到内存带宽限制的窘境,数倍提升推理性能。并且,其价格极具竞争力。

宝德在基于此CPU和Intel Flex GPU的自研服务器PR2715E上开发部署了LLM方案-聊德宝,它拥有调用私域数据的能力,让AI应用更加智能化、个性化地为用户提供服务,目前已经应用于宝德服务器AI客服、金沙古酒AI客服、金沙古酒直播数字人等产品。聊德宝具有快速迁移、便捷部署、多路并发的显著优势;最重要的是,该方案价格同比其它常规方案最高节约超过50%!
更妙的是,近日宝德服务器全面升级到第五代英特尔®至强®平台,第五代英特尔®至强®处理器除了具有更可靠的性能和更出色的能效外,它的AI性能大幅度提升,每个内核都具备 AI 加速功能,无需添加独立加速器,就可处理要求严苛的 AI 工作负载,包括对参数量多达 200 亿的模型进行推理和调优。 因此宝德AIGC解决方案将进一步测试适配升级到第五代英特尔®至强®平台,为客户部署AI应用提供更具性价比的优选方案。

大模型和AIGC正在日新月异地蓬勃发展,加速应用场景落地和引领产业变革势不可挡。宝德将继续携手英特尔,发挥AI优势,联合创新研发和应用,不断迭代优化生成式AI解决方案,为数据中心等客户打造高效便利和更加普惠的AI基础设施,加速释放AI动能,更好地服务中国数字经济高质量发展!
相关文章
- 像素蛋糕优化适配英特尔Panther Lake平台,AI修图效率提升145%
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 荣耀MagicBook全线新品亮相英特尔第三代酷睿Ultra处理器新品分享会
- OpenClaw 全新搭档:英特尔芯铭凡M2 Pro 重塑隐私与实用平衡
- ThinkPad AI PC亮相英特尔第三代酷睿Ultra处理器新品分享会
- 英特尔推出面向边缘计算的Bartlett Lake与Panther Lake处理器:最高12个性能核、频率达5.9GHz
- AI PC跨端融合:英特尔携手伙伴,重塑个人计算体验与市场增长
- 英特尔EMIB封装技术挑战台积电CoWoS,或成为解决AI封装瓶颈的利器
- 英特尔与爱立信达成合作,AI原生6G推动网络感知与计算深度融合
- 英特尔以精准算力赋能网络AI,从容迈向6G
- 英特尔正式为锐炫Alchemist和Battlemage显卡推出XeSS 3多帧生成技术
- 英特尔Panther Lake处理器推出紧凑型模块,亮相边缘AI与嵌入式平台
- 英特尔和AMD CPU缺货持续加剧,价格普遍上涨
- 香港科技大学与英特尔共建联合实验室,聚焦高能效智能计算
- DeepSeek最火Engram怎么跑?英特尔至强+AMX实测:性能提升达1.67倍!
- 英特尔与忆联共同推出企业级网络存储解决方案,全面赋能AI训练与推理效率跃升
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









