入选 SOSP 2025!趋境科技 KTransformers 突破异构计算瓶颈,大模型推理成本大降
2025-11-23 10:38:12AI云资讯1742
趋境科技与清华共同开源的高性能异构推理框架 KTransformers,其论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》成功入选 “计算机系统领域奥斯卡” SOSP 2025。作为计算机系统领域最具影响力的国际顶会之一,SOSP 见证了无数里程碑式技术成果的首次亮相,从虚拟化到分布式文件系统,此次 KTransformers 的入选,标志着其异构计算技术得到全球顶尖学术与工业界的认可。

KTransformers 专注于高效利用底层 GPU、CPU、内存等多样化算力,让大模型在更低算力、更灵活的硬件架构上高效运行。在大模型推理中,趋境科技提出了一条不同以往的道路:一套面向 CPU+GPU 异构架构的 MoE 推理系统方案,让原本只能依赖昂贵多卡 GPU 的大模型,能在 CPU 参与的硬件环境中实现接近同等性能的推理体验。技术层面上,它通过一系列系统级创新,让 GPU 负责注意力和主干网络的高并行计算,CPU 则承担稀疏专家模块的推理任务,实现了高效的 CPU+GPU 协同执行。
11 月 6 日月之暗面发布 Kimi-K2-Thinking 模型后,KTransformers 已完成对该模型的全面适配,支持用户在单卡环境下完成推理任务,2 卡环境下完成 LoRA 微调任务,大幅降低部署与定制化门槛。同时,趋境科技也已完成了该模型在昇腾 NPU 上的全面适配,提供了完善的全国产化推理解决方案。
10 月,KTransformers 与主流推理框架 SGLang 的合作,双方架构合入同一分支,在 Kimi-K2-1TB 的模型推理任务中,用户仅需简单安装 SGLang 与 KTransformers CPU 内核,下载官方模型及量化权重,即可通过一条命令启动服务;同时仅使用单张消费级 GPU+CPU。此次合作融合了 GPU+CPU 异构推理创新模式与全 GPU 的传统推理模式,双方联合推动大模型推理向更高性能、更低成本的方向演进,同时推动大模型推理架构变得更加完善,将迈向更广泛的产业落地。

针对模型微调,KTransformers 与 LLaMA-Factory 深度集成,支持用户使用 LoRA 等轻量级微调方法,在极少量 GPU 资源下完成模型定制。传统上,LoRA 微调千亿模型成本高达数百万,趋境科技提供的异构微调能力将资源需求降低到单个消费级 GPU(如 RTX 4090)起,这使得高校、中小型实验室、初创公司甚至个人开发者都有机会参与进来。该微调方案在较小规模的 MoE 模型(DeepSeek-14B)上面也展现了超过传统方案 1.8 倍的吞吐、显存占用降低 82%,成为消费级显卡上微调超大参数 MoE 模型的唯一可行方案。
如今的 KTransformers 已成为一个被开发者、厂商与开源社区广泛复用的共建式底层框架。全球头部开源模型方,如 Qwen、Kimi、智谱 AI 等多个主流大模型,都在模型发布首日就推荐 KTransformers 作为推理引擎支持;其工程实践与兼容性也被多家一体机产品线采纳。趋境科技始终是异构路线的核心推动者,已与多个国产 CPU、GPU 硬件平台合作,共同推进全国产高性价比方案;为数十家行业开发伙伴提供算力底座,逐步实现算力普惠。未来,趋境希望让 AI 能力不再专属于少数企业,让大模型真正为业务所用。
相关文章
- 携手共建“物理世界大模型”联合实验室,洞察时空与上海电信达成战略合作
- 东软添翼医疗大模型领跑 医疗AI进入“可信时代”
- 直接上智能体,还需要统一基座大模型吗?医院智能化走到十字路口
- 云知声 U2-ASR 2.5上线:首个中文方言语义转写大模型
- 全国首个内容审核大模型过审 云从科技破解Agent时代谣言难题
- 湖北移动AI实验室让中小企业零门槛用上大模型
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 荆华密算入选主流价值语料生态联盟首批成员,护航大模型时代,为AI系上“安全带”
- 稳居第一梯队!东软添翼医疗大模型用实力回应“医疗AI”
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 唯一聚焦制造业!创新奇智入围IDC大模型私有化市场前五
- 可视、可管、可算、可追溯!浩鲸科技重磅推出鲸智大模型Token运营平台
- 数字峰会探新“智”| 数字中国AI竞速:大模型从“能力竞赛”转向“可信落地”
- 数字峰会探新“智”|为AI装上“质检员”,浪潮软件集团发布大模型“体检”方案
- AI大模型智能体独角兽再落子!探迹科技完成真爱美家收购交割,持股达 43%
- 北京亦庄设立大模型生态服务站 助力AI产业合规发展
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









