入选 SOSP 2025!趋境科技 KTransformers 突破异构计算瓶颈,大模型推理成本大降
2025-11-23 10:38:12AI云资讯1353
趋境科技与清华共同开源的高性能异构推理框架 KTransformers,其论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》成功入选 “计算机系统领域奥斯卡” SOSP 2025。作为计算机系统领域最具影响力的国际顶会之一,SOSP 见证了无数里程碑式技术成果的首次亮相,从虚拟化到分布式文件系统,此次 KTransformers 的入选,标志着其异构计算技术得到全球顶尖学术与工业界的认可。
KTransformers 专注于高效利用底层 GPU、CPU、内存等多样化算力,让大模型在更低算力、更灵活的硬件架构上高效运行。在大模型推理中,趋境科技提出了一条不同以往的道路:一套面向 CPU+GPU 异构架构的 MoE 推理系统方案,让原本只能依赖昂贵多卡 GPU 的大模型,能在 CPU 参与的硬件环境中实现接近同等性能的推理体验。技术层面上,它通过一系列系统级创新,让 GPU 负责注意力和主干网络的高并行计算,CPU 则承担稀疏专家模块的推理任务,实现了高效的 CPU+GPU 协同执行。
11 月 6 日月之暗面发布 Kimi-K2-Thinking 模型后,KTransformers 已完成对该模型的全面适配,支持用户在单卡环境下完成推理任务,2 卡环境下完成 LoRA 微调任务,大幅降低部署与定制化门槛。同时,趋境科技也已完成了该模型在昇腾 NPU 上的全面适配,提供了完善的全国产化推理解决方案。
10 月,KTransformers 与主流推理框架 SGLang 的合作,双方架构合入同一分支,在 Kimi-K2-1TB 的模型推理任务中,用户仅需简单安装 SGLang 与 KTransformers CPU 内核,下载官方模型及量化权重,即可通过一条命令启动服务;同时仅使用单张消费级 GPU+CPU。此次合作融合了 GPU+CPU 异构推理创新模式与全 GPU 的传统推理模式,双方联合推动大模型推理向更高性能、更低成本的方向演进,同时推动大模型推理架构变得更加完善,将迈向更广泛的产业落地。
针对模型微调,KTransformers 与 LLaMA-Factory 深度集成,支持用户使用 LoRA 等轻量级微调方法,在极少量 GPU 资源下完成模型定制。传统上,LoRA 微调千亿模型成本高达数百万,趋境科技提供的异构微调能力将资源需求降低到单个消费级 GPU(如 RTX 4090)起,这使得高校、中小型实验室、初创公司甚至个人开发者都有机会参与进来。该微调方案在较小规模的 MoE 模型(DeepSeek-14B)上面也展现了超过传统方案 1.8 倍的吞吐、显存占用降低 82%,成为消费级显卡上微调超大参数 MoE 模型的唯一可行方案。
如今的 KTransformers 已成为一个被开发者、厂商与开源社区广泛复用的共建式底层框架。全球头部开源模型方,如 Qwen、Kimi、智谱 AI 等多个主流大模型,都在模型发布首日就推荐 KTransformers 作为推理引擎支持;其工程实践与兼容性也被多家一体机产品线采纳。趋境科技始终是异构路线的核心推动者,已与多个国产 CPU、GPU 硬件平台合作,共同推进全国产高性价比方案;为数十家行业开发伙伴提供算力底座,逐步实现算力普惠。未来,趋境希望让 AI 能力不再专属于少数企业,让大模型真正为业务所用。
相关文章
- 入选 SOSP 2025!趋境科技 KTransformers 突破异构计算瓶颈,大模型推理成本大降
- 让智能体开发如“拼积木”般便利!合合信息携手火山引擎共探大模型落地新范式
- 2025 AI视频大模型排行:可灵登顶,创作革命来袭
- 谷歌发布新一代大模型Gemini 3,AI搜索能力显著增强
- “AI100应用标杆榜”公布 文心大模型获“基础要素”首个案例
- 显著提升音乐推荐效果!网易云音乐大模型获全球学术会议CIKM2025最佳论文奖
- 博威合金AI大模型驱动铜合金创新,破解高速连接器可靠传输难题
- 老板电器食神大模型成功斩获“备案大满贯”,再添国家级认证 !
- 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路
- 告别冰冷的监控,迎来「懂你」的AI智能伙伴!神眸大模型的全新进化
- 望石智慧入选 AI4LS 权威蓝皮书!以 3D 分子生成大模型引领小分子生成式 AI 时代
- 达内教育AI人工智能及大模型课程 零基础进阶,抢占智能时代新风口
- 易鑫正式发布汽车金融行业首个Agentic大模型
- 乌镇峰会迎来“浙江新势力” 德适生物医学影像通用大模型荣膺“新光”产品
- 开启品牌评估智能模式:元景品牌价值人工智能大模型重磅发布
- 小鹏科技日:第二代VLA大模型与三大具身智能产品齐发 勾勒物理AI未来出行新图景









