浙江流流电子科技布局AI推理芯片方向:以3D集成与Hybrid Bonding技术探索高能效专用计算新路径
2026-06-24 17:26:57AI云资讯1976
近日,浙江流流电子科技有限公司表示,公司正在将过往在 3D 集成专用计算芯片领域积累的工程经验,延展至 AI 推理芯片方向。未来,公司将围绕高能效 AI 推理 ASIC、3D 集成架构、Hybrid Bonding 高密度互连以及低功耗专用计算体系展开技术布局。
据公司介绍,流流科技创始团队曾参与研发并推动量产过一款基于 40 纳米工艺、采用 Hybrid Bonding 技术的以太坊专用计算芯片。该芯片于 2021 年进入量产阶段,是团队在先进封装、高并行计算、低功耗架构和专用 ASIC 工程化方面的重要实践。
流流科技认为,从以太坊专用计算芯片到 AI 推理芯片,变化的是应用场景,不变的是底层工程逻辑:如何在有限功耗、有限面积和有限数据通路条件下,最大化单位能耗下的有效计算能力。
一、从 40 纳米 Hybrid Bonding 芯片量产经验出发
在专用计算芯片领域,量产经验往往比单纯的设计概念更具价值。
流流科技创始团队此前参与的 40 纳米以太坊专用计算芯片,并非传统意义上的普通 ASIC,而是一款采用 3D 集成思路和 Hybrid Bonding 技术的专用计算芯片。该产品于 2021 年进入量产阶段,意味着相关团队曾经实际经历过从芯片架构、三维互连、封装协同到量产可靠性的完整工程挑战。
对于任何采用 3D 集成路线的芯片而言,Hybrid Bonding 都不是简单的封装后处理步骤。它会影响芯片层级划分、互连密度、信号传输路径、热分布、测试覆盖以及最终产品的稳定性。因此,能够参与并推动此类芯片进入量产,本身代表了团队对 3D 集成芯片工程复杂度的实际理解。
这也是流流科技此次布局 AI 推理芯片的重要基础。
二、Hybrid Bonding:3D 集成芯片的关键互连方式
在表述上,“3D 集成”和“Hybrid Bonding”并不是两个割裂的技术概念。
更准确地说,Hybrid Bonding 是实现高密度 3D 集成的重要技术路径之一。它通过晶圆与晶圆、芯片与晶圆或芯片与芯片之间的高密度互连,使不同功能层能够在垂直方向上形成更短、更密集的数据连接。
传统二维芯片设计中,计算单元、缓存、控制逻辑和数据通路都需要在同一平面上展开。随着芯片规模扩大,长距离布线、片上拥塞、访问延迟和功耗都会成为限制性能提升的重要因素。
而 3D 集成提供了另一种思路:将不同功能模块在垂直方向上组织起来,使计算、存储和数据通路之间的距离进一步缩短。Hybrid Bonding 则为这种垂直组织方式提供了更高密度、更低寄生、更短路径的互连基础。
对于高能效专用计算芯片而言,这种技术路线的核心价值并不是简单“把芯片叠起来”,而是让芯片内部的数据流动更加高效。
三、从 ETH 专用计算到 AI 推理:不是算法迁移,而是工程能力迁移
流流科技表示,以太坊专用计算芯片与 AI 推理芯片面向的是完全不同的应用场景,因此不能简单理解为“把原来的芯片换一个用途”。
真正能够迁移的,是底层工程能力。
以太坊专用计算芯片强调高并行、低功耗、稳定运行和单位能耗下的计算效率;AI 推理芯片同样关注高并行计算、数据吞吐、功耗控制和持续运行效率。二者虽然执行的算法不同,但都属于典型的专用计算芯片,都需要围绕特定工作负载进行架构优化。
在 AI 推理场景中,芯片面对的不只是矩阵乘法本身,还包括模型权重读取、激活数据缓存、中间结果传输、片上数据复用以及外部存储访问等问题。大量能耗并不完全发生在计算单元内部,而是发生在数据移动过程中。
因此,流流科技认为,过去在 Hybrid Bonding 3D 集成专用计算芯片中的经验,可以为 AI 推理芯片提供重要参考:通过更紧凑的计算-存储组织方式,降低无效数据搬运,提高单位功耗下的有效推理能力。
四、AI 推理芯片的核心竞争:从峰值算力转向有效算力
随着 AI 应用进入大规模部署阶段,推理芯片的评价标准正在发生变化。
过去,AI 芯片常常以理论算力、制程节点和峰值性能作为主要宣传指标。但在真实部署中,客户更加关注的是芯片在持续运行状态下的能效、稳定性、部署密度和长期使用成本。
对于企业私有化 AI 部署,芯片需要在有限电力和有限服务器空间内提供稳定推理能力。
对于边缘 AI 场景,芯片需要控制功耗、散热和体积。
对于视频理解和多模态检索场景,芯片需要处理持续、高频、并发的数据流。
对于语言模型推理,芯片则需要在延迟、吞吐和存储访问之间取得平衡。
这些场景都指向同一个问题:AI 推理芯片的核心不只是“有多少算力”,而是“有多少算力能够被真实模型有效利用”。
这也是专用 ASIC 芯片存在机会的地方。
五、3D 集成有望缓解 AI 推理中的数据搬运瓶颈
AI 推理芯片的能效瓶颈,往往来自计算与存储之间的不匹配。
随着模型参数规模提升,芯片需要不断读取权重、缓存激活数据、传输中间结果。如果计算阵列与存储结构之间距离过长,或者片上数据复用率不足,就会造成大量无效功耗。
3D 集成架构为这一问题提供了新的解决空间。通过垂直方向上的功能组织,芯片可以尝试将计算层、缓存层和数据通路进行更紧密的协同设计,使部分关键数据路径更短,互连密度更高,片上数据复用效率更好。
Hybrid Bonding 在其中的意义,是为不同芯片层之间提供高密度连接能力。对于 AI 推理 ASIC 而言,这种能力有机会帮助芯片降低外部访存压力,减少数据搬运功耗,并提升实际推理场景下的能效表现。
六、成熟工艺结合先进封装,成为专用 AI 芯片的重要方向
流流科技认为,AI 推理芯片并不一定只有依赖最先进制程这一条路径。
在高端训练芯片领域,先进制程、高带宽显存和大规模集群互联非常重要。但在大量推理场景中,客户更加关注成本、稳定性、供货能力、功耗表现和部署灵活性。
因此,成熟工艺结合先进封装,正在成为专用 AI 推理芯片的一种现实路线。
成熟工艺可以带来更可控的设计成本和制造风险,而 3D 集成与 Hybrid Bonding 则有机会从架构层面提升数据流效率。二者结合后,芯片不一定追求通用计算能力的极限,而是围绕特定推理场景做更高效的专用优化。
对于流流科技而言,从此前参与量产的 40 纳米 Hybrid Bonding 以太坊专用计算芯片,到未来布局 AI 推理芯片,本质上是一条从“专用计算”走向“专用智能计算”的技术延展路径。
七、从专用计算经验走向 AI 推理架构创新
流流科技表示,公司未来将围绕 AI 推理 ASIC、高能效专用计算、3D 集成、Hybrid Bonding 和低功耗数据流架构持续展开技术研究。
公司认为,AI 推理市场正在逐步分层。通用 GPU 仍将在大规模训练和通用 AI 计算中占据重要位置,但在部分垂直推理场景中,专用 ASIC 有机会通过更聚焦的架构设计获得能效优势。
与通用芯片相比,专用推理 ASIC 不追求覆盖所有任务,而是围绕特定模型结构、特定算子类型和特定部署环境进行优化。通过减少冗余逻辑、优化数据流、提高片上数据复用率,并结合 3D 集成技术改善计算与存储之间的连接效率,专用芯片有望在单位功耗和单位成本上形成差异化。
流流科技表示,过去参与 Hybrid Bonding 3D 集成芯片量产的经历,使团队更加重视芯片从设计概念到真实产品之间的工程落差。未来,公司将继续以工程可落地为导向,探索面向 AI 推理的新型专用计算架构。
八、结语:以 3D 集成经验切入 AI 推理芯片新阶段
从 40 纳米 Hybrid Bonding 以太坊专用计算芯片,到面向 AI 推理的专用 ASIC 架构探索,流流科技正在尝试将过往在高能效专用计算和 3D 集成领域的经验,转化为面向新一代 AI 应用的芯片能力。
在 AI 推理需求快速增长的背景下,市场对芯片的要求正在从单纯的峰值算力,转向更实际的能效、成本、稳定性和部署效率。3D 集成与 Hybrid Bonding 技术,为专用 AI 推理芯片提供了新的架构可能。
流流科技表示,公司将继续围绕先进封装与专用计算架构的结合展开技术布局,希望在 AI 推理芯片领域探索一条兼具工程可行性和能效优势的发展路径。
相关文章
- 微软发布首款AI推理模型MAI-Thinking-1
- Anthropic看中英国初创公司融合技术,以仅英伟达Groq十分之一的成本,实现百倍速度的AI推理
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 海康存储亮相2026人工智能基础设施峰会 加速布局AI推理存储新赛道
- 云天励飞千卡AI推理集群落地湛江,打造“国模国芯”生态样板
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达Blackwell平台为AI推理工作负载带来全新水平的Token优化
- 服务器迎AI推理驱动新周期,行业竞争向系统化能力升级
- 国产存储突破:绿算GP7000率先适配英伟达G3层KV Cache架构,AI推理效率提升17倍
- 光本位科技研发出玻璃光计算芯片,算力有望超传统AI推理芯片的千倍
- 从Akamai到白山云,AI推理正在重塑全球算力版图
- 云天励飞携全栈AI推理芯片产品亮相湾芯展,引领“推理时代”新赛道
- 云天励飞拟赴港上市:中国AI推理芯片独角兽
- 云天励飞AI推理芯片亮相联合国舞台,为全球AI普惠贡献中国智慧
- 超低延时重构AI推理体验!白山云发布“大模型API”产品
- 中国首个专注AI推理的Serverless GPU产品上线:清华力量共绩科技驱动AI普惠
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









