韩国AI芯片企业FuriosaAI下一代AI加速器采用2nm芯粒架构，支持HBM4/E内存-AI云资讯

（AI云资讯消息）韩国AI芯片企业FuriosaAI 与博通联手打造高性能 AI 加速器芯片，搭载下一代 HBM4/E 内存。

FuriosaAI 已发布其第三代 AI 加速器，该产品基于目前正在台积电 5nm 制程上量产的二代 RNGD 平台打造。二代 RNGD AI 平台采用 180W PCIe 板卡形态设计，专攻大语言模型与智能体 AI 工作负载。随着智能体 AI 需求持续激增，下一代产品将全面发力 AI 推理市场。

FuriosaAI 第三代 AI 加速器平台将 2nm 计算技术与 HBM4/4E 内存相结合，旨在为大规模 AI 计算集群提供高带宽、机架级互联网络。它的架构针对高要求的推理工作负载进行了优化，专注于高带宽数据搬运，从而提供比最高效的 GPU 更出色的每瓦性能和更高的令牌密度。此外，它基于 Furiosa 当前已进入量产阶段的 RNGD 芯片打造，客户包括三星 SDS 和 LG AI 研究院。

根据 FuriosaAI 分享的部分细节，该芯片平台将采用先进的 2nm 计算芯片和 HBM4/E 内存标准。该公司正与博通合作，利用先进的封装技术，将多个硅芯片集成到单一的高性能 AI 芯片（系统级芯片）中。

在预告图中，公司展示了第三代 AI 芯片，配备 12 个 HBM4/E 内存位点、两个大型计算芯粒（2nm）和两个 IO 控制器。如果 Furiosa 采用 12 层堆叠、每堆叠 36 GB 的内存模块，总内存容量将达到 432 GB。

除了计算架构之外，FuriosaAI 还将采用博通的以太网和 PCIe IP，从而在大规模 AI 计算集群中实现更高带宽的机架级互联。该 AI 芯片针对后训练采样等高要求的真实 AI 工作负载进行了优化，高带宽是核心关注点，这正是公司选择采用最新 HBM4/E 标准的原因。

FuriosaAI公司声称，其专注于带宽而非线程管理的设计理念，将使其能够提供比现代 GPU 架构更高的效率和更高的令牌吞吐量。此外，公司还表示其软件栈可让开发者快速部署新的 AI 模型，同时满足吞吐量和延迟要求。

Furiosa 的 SDK 采用通用编译器，可自动将高层级 PyTorch 代码映射到芯片硬件。对于需要更精细控制的开发者，Furiosa 的虚拟 ISA 提供了一种声明式编程模型，既能实现对硬件的掌控，又避免了传统 GPU 编程中的不确定性复杂性。

关于上市时间，FuriosaAI 第三代加速器预计将于 2028 年上半年开始提供样片，届时将满足下一代 AI 数据中心的计算需求。

韩国AI芯片企业FuriosaAI下一代AI加速器采用2nm芯粒架构，支持HBM4/E内存

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术