首次商用试运行,类脑智算集群支持大模型快速推理服务
2025-08-14 14:16:40AI云资讯2627
据悉,“杭州灵汐类脑智算集群”已于7月底实现了大模型快速推理API的企业服务试运行。该集群由杭州灵汐类脑科技有限公司牵头搭建运营,中国电信、中国电子科技南湖研究院以及脑启社区作为合作方参与,由杭州电信具体承担集成建设。该集群部署在中国电信杭州智算中心,算力规模超200POPS。这也是类脑智算集群在全球范围内,首次以支持大模型快速推理的方式,走向商用试运行。
作为类脑智能技术的创新应用成果,该智算集群具有”存算一体、众核并行、稀疏计算、事件驱动”的特性,可显著提升计算效率、大幅降低能耗,实现大语言模型推理的“一快、一低、一降”:一是推理速度快,单用户的推理延迟控制在毫秒级别,速度性能相对于传统方案有明显优势(可流畅响应实时交互及长本文深度推理),告别卡顿;二是首token延迟低,可降至百毫秒乃至十毫秒级;三是智算集群的功耗大幅下降,较业界同等推理算力水平可降低功耗二分之一至三分之二以上。异构融合类脑芯片具有兼容PyTorch框架的类CUDA软件栈,可直接服务于多类开源大模型的快速推理、而不需要转换类脑算法。

图1灵汐智算平台大模型登录

图2灵汐智算平台大模型快速推理
当前,大模型推理普遍存在吞吐速度慢(每秒十到几十词输出)和高延迟问题(常常超过1秒甚至数秒),对众多行业场景构成了制约。在此背景下,灵汐科技基于类脑智能技术给出了“高实时、高吞吐、低延迟“的推理服务解决方案,将在金融应用、情感陪聊、快速导览、大规模数据标注以及无人机实时航拍处理、灾害预警与应急处置等领域场景逐步落地。据介绍,该智算集群(中心)将持续升级,新一代类脑智算高密度计算平台也将在近期正式发布推出,集群能效比预计将进一步提升。
相关文章
- 亮相硅谷・智领全球:安世腾重磅发布全栈智算与通用具身智能解决方案
- 数翊科技出席第九届数字中国建设峰会,以dataeasy智算平台加速具身智能工业落地
- 基石智算上线Kimi K2.6,即刻体验高效智能体协作
- 云工场科技(02512.HK)落子无锡 携手沐曦股份+AMD双线发力国产智算新赛道
- 冷端可靠供冷,热端高效回收!海尔智算中心AIDC全场景方案赋能绿色算力生态
- Aginode安捷诺:OpenClaw开启的智能体浪潮,如何重塑下一代智算网络?
- Aginode安捷诺:当AI重塑算力格局,智算网络技术如何应对多维挑战?
- 基石智算上线 GLM-5.1,长周期智能体与高阶代码推理新体验
- 艾晨数能:以极致创新定义智算中心“动力心脏”,用硬核实力领跑模块化UPS新赛道
- “算网筑基 智领未来” 2024人工智能与智算应用发展研讨会在乌镇召开
- 上海交通大学:高校最大智算平台,“AI+科研、管理”协同创新
- “AI拉动云”飞轮效应凸显 金山云打开智算云增长天花板
- 全栈AIInfra护航,青云智算出席出海产业链研讨会
- 高工智算对话科士达:AIDC热浪下,基础设施供应商的冷静思考
- 智算云收入扛起大旗 AI时代金山云的想象空间有多大?
- 香港单体规模最大智算中心——中国移动环球智算中心开幕
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









