大模型算力新选择——宝德AI服务器采用8颗英特尔Gaudi®2加速器
2023-07-20 09:38:27AI云资讯1482
近日,英特尔专门针对中国市场推出深度学习加速器Habana®Gaudi®2.以领先的性价比优势,加速AI训练及推理,提高深度学习性能和效率,从而成为大规模部署AI的更优解。作为英特尔在中国最重要的战略合作伙伴和中国AI服务器市场的TOP3.宝德计算积极携手英特尔,推出了支持8颗Gaudi®2加速器的AI加速计算服务器——PR8908WG,具有高性能、可扩展性强、高能效和开箱即用等优势,能够为AI客户尤其是大模型训练和推理提供超高性价比的算力支撑。
全新Gaudi®2训练加速器,专为深度学习而生

Gaudi®2采用7nm制程工艺,拥有高性能架构,具备24个可编程Tensor处理器核心(TPCs),21个100Gbps(RoCEv2)以太网接口,96GB HBM2E内存容量,2.4TB/秒的总内存带宽,48MB片上SRAM,并且集成多媒体处理引擎,为训练大语言模型提供高性能、高可扩展性和高能效的AI算力,在MLCommons®MLPerf@基准测试之GPT-3模型、计算机视觉模型ResNet-50、Unet3D、以及自然语言处理模型BERT等方面均取得了优异的成绩。
生成式AI和大语言模型需要服务器集群来满足大规模且更加复杂的计算要求。英特尔Gaudi®2处理器作为一款高性能、完全可编程的AI处理器,整合了多项技术创新,具有高内存带宽/容量和基于标准以太网技术的纵向扩展能力,并支持使用外接网卡通过PCle接口实现横向扩展,可满足多节点集群需要。同时,英特尔不断打造领先、成熟的软件生态支持,SynapseAI®软件套件就针对Gaudi平台深度学习业务进行了优化,它集成了对TensorFlow和PyTorch框架的支持,并提供众多流行的计算机视觉和自然语言参考模型,能够满足深度学习开发者的多样化需求。
宝德AI服务器PR8908WG+ Gaudi®2.大模型算力新选择

宝德AI服务器PR8908WG采用第三代英特尔®至强®可扩展处理器,8U空间支持8颗OAM高速互联的Gaudi®2 AI加速器,每颗Gaudi®2芯片配置96GB HBM高速内存,GPU与 GPU 之间互联带宽达到400GB/s,提供2.1Tbps的P2P互联带宽,支持全互联拓扑,全面满足大模型训练的海量通信需求;它支持200Gb ETH和HDR高速智能网卡,支持GPU Direct RDMA,完美满足集群和超大规模扩展应用。
PR8908WG拥有32个DDR4 DIMM插槽,最大支持8TB 32x 256 GB DRAM;支持24块2.5英寸SAS/SATA热插拔硬盘位,默认支持8块直连SATA硬盘,4块NVMe U.2 SSD,同时内置2个NVMe M.2 SSD,实现 CPU 直通设计,降低 I/O 延迟;它提供2个PCIe 4.0 x16 FHFL插槽和2 个PCIe 4.0 x8 FHFL插槽;支持以太网、InfiniBand、OPA等多种不同网络选择和互联需求。
PR8908WG整机采用模块化设计,独立的GPU和CPU 热量分区设计确保系统在最苛刻的工作负载下性能和稳定性不受影响;同时板载集成BMC、支持通过RAID卡超级电容、支持IPMI 2.0远程管理等,非常方便用户对AI算力设备的维护管理。
综上,宝德AI加速计算服务器PR8908WG可以满足AI不同场景下海量数据的计算和推理需求,特别适用于大模型训练和推理、深度学习、自动驾驶、智能城市、医疗健康、大数据、高性能计算(HPC)和虚拟现实等应用场景,帮助加速更多AI技术的落地和应用。

大模型将带来AI新价值,“百模大战时代”已经来临。随着各大模型的争奇斗艳和对成本、盈利模式等的日益关注,性价比为王将成为AI算力的新标准。作为中国领先的计算产品方案提供商,宝德计算将继续发挥AI服务器领域的技术优势和市场经验,携手英特尔等合作伙伴不断创新,探索大模型算力的更多选择,打造更具性价比的AI算力和解决方案,助力中国大模型更多细分场景的落地和商业变现,共同加速中国大模型技术的发展步伐,推动中国人工智能产业的整体升级!
相关文章
- 携手共建“物理世界大模型”联合实验室,洞察时空与上海电信达成战略合作
- 东软添翼医疗大模型领跑 医疗AI进入“可信时代”
- 直接上智能体,还需要统一基座大模型吗?医院智能化走到十字路口
- 云知声 U2-ASR 2.5上线:首个中文方言语义转写大模型
- 全国首个内容审核大模型过审 云从科技破解Agent时代谣言难题
- 湖北移动AI实验室让中小企业零门槛用上大模型
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 荆华密算入选主流价值语料生态联盟首批成员,护航大模型时代,为AI系上“安全带”
- 稳居第一梯队!东软添翼医疗大模型用实力回应“医疗AI”
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 唯一聚焦制造业!创新奇智入围IDC大模型私有化市场前五
- 可视、可管、可算、可追溯!浩鲸科技重磅推出鲸智大模型Token运营平台
- 数字峰会探新“智”| 数字中国AI竞速:大模型从“能力竞赛”转向“可信落地”
- 数字峰会探新“智”|为AI装上“质检员”,浪潮软件集团发布大模型“体检”方案
- AI大模型智能体独角兽再落子!探迹科技完成真爱美家收购交割,持股达 43%
- 北京亦庄设立大模型生态服务站 助力AI产业合规发展
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









