服务器迎AI推理驱动新周期,行业竞争向系统化能力升级
2026-01-23 16:35:07AI云资讯1432
1月20日,研究机构TrendForce在最新报告中指出,全球AI服务器市场正迎来新一轮爆发。预计到2026年,全球AI服务器出货量将实现28.3%的同比增长,扩张速度明显快于2025年。
行业加速增长的背后,是AI产业的发展重心,正从从“模型训练”逐渐转向“推理应用”。近期,OpenAI、谷歌、Anthropic纷纷公布翻倍式的收入增长成果,即是这一变化的显性表现。同时,无论是OpenAI等大模型厂商,还是联想集团等应用服务厂商,均开启新一轮应用端布局,成为应用端推理算力需求的加速推动者。
在此背景下,服务器行业竞争逻辑也正发生改变,联想集团这类不仅与大模型厂商在算力环节深度绑定,在应用环节也实现深度合作的企业,正不断扩大其市场份额。
与此同时,ASIC芯片方案的崛起,也正成为市场竞争格局变化的新变量。TrendForce预计,基于ASIC的AI服务器出货占比将提升至27.8%,而传统的GPU服务器市占率则可能首次跌破70%关口。
推理驱动的新一轮爆发
作为全球服务器行业主要供应商之一,联想集团董事长兼CEO杨元庆曾简单总结算力基础设施行业的多轮变迁,从依托传统计算的企业信息化与数字化转型驱动,到云服务、云应用驱动,再到大语言模型训练催生的大规模算力集群,每一轮创新浪潮的洗礼,都带来行业新一轮增长机遇。
“如今,我们正迎来新一轮AI推理浪潮——通过强大的算力设备,把AI能力部署到本地、边缘和用户端,让智能触手可及,贴近企业与用户的指尖。”杨元庆表示。

这实际上说的是AI产业进入应用落地阶段的现实。近日,OpenAI公布,公司2025年年度经常性收入(ARR)已突破200亿美元,较2024年的60亿美元增长超两倍;谷歌也爆出Gemini API调用量增长逾一倍,达到850亿次,Gemini企业端已增长至800万订阅用户的消息。两家国际科技巨头在收入和用户数上的翻倍式增长,充分显示出AI应用端开始爆发的趋势。
不只是模型端,联想集团同时作为应用端企业代表,也显示出业务规模化的表现。联想集团旗下专注国内市场的天禧AI智能体,月活跃用户已突破2.8亿,年分发量突破40亿次,开发者注册人数超过23万,并已孕育出超过5000款领域智能体和AI应用。
应用端的落地,是比大语言模型训练大得多的新市场。有数据认为,在模型生命周期内,推理成本是训练成本的15倍。以OpenAI为例,2024年其大模型训练支出仅为1.5亿美元,而推理支出则达到23亿美元。
并且,推理成本较训练成本的倍数关系,正以指数级速度攀升。其背后逻辑是,用户数越多,用户平均调用次数越多,推理算力需求在模型全生命周期内的比例就越大。换言之,2025年作为OpenAI收入爆发之年,其推理支出与训练支出之间的差异更大。这一变化在其他大模型厂商身上也一样存在。
2026年,OpenAI将“务实采纳”(practical adoption),即致力于缩小AI现有能力与用户实际需求之间的差距列为工作重点;联想集团也通过发布面向海外市场的个人超级智能体Qira,开启全球市场扩张。两家企业一为模型端国际龙头,一为应用端领先企业,他们的布局动向,也体现了整个行业的发展方向。这意味着,2026年整个AI行业将迎来用户数、用户平均调用次数的同时提升,为服务器行业较2025年更快的增长速度奠定了基础。
当行业向应用端转移,服务器作为AI算力基础设施核心硬件,也需要向应用端强化适配。联想集团近期就发布了多款专门面向人工智能推理工作负载的服务器产品,包括AI推理服务器SR675i、SR650i和边缘计算服务器SE455i等。比如,ThinkSystem SR650i即可凭借高密度图形处理器算力,提供加速人工智能推理能力,其设计可直接适配现有数据中心的部署环境。

同时,服务器厂商与大模型厂商之间的关系,也开始发生微妙变化。在应用端适配的需求,使得他们更倾向于与那些更懂得应用端的服务器企业合作。“算力+应用”双绑定模式,成为这类服务器厂商的独特优势。
联想集团即是其中一例。其既为阿里、DeepSeek、字节跳动、谷歌、微软等众多国内外大模型厂商提供服务器等算力基础设施硬件,也在AI PC、AI手机等智能设备终端,及AI在政务、企业、金融、商业等各行各业的场景落地中开展合作。
这种合作机制的优胜之处在于,联想集团既能凭借在长期参与数据中心建设中积累的经验,为大模型训练创造更优的算力环境,也能凭借自身作为应用服务企业对终端设备、应用场景的理解,精准配置服务器性能与机柜集成方案,更好地发挥大模型在应用端的表现,同时以自身掌握的经验、数据,反向赋能大模型优化。这是单纯在算力环节与大模型厂商绑定的企业所不具备的能力,也是大模型厂商更青睐的能力。
更重要的是,联想集团在应用端的布局,覆盖终端设备与场景落地服务,对应用端的理解更全面,即便是在“算力+应用”双重绑定的企业中,也具备更突出竞争优势。
随着前述Qira智能体的发布,联想集团在海外应用端布局加速,与海外大模型厂商在应用端的合作也将进一步深化,这种双重绑定优势也将随之强化。目前已知的是,联想集团与谷歌、微软都在此前的智能终端设备合作之外,通过将其大模型接入Qira智能体,拓展了新的应用端合作内容。

IDC数据显示,自2024年以来,联想集团全球市场份额呈明显的波动上升趋势,已从2024年一季度的5.3%,升至2025年二季度的6%,其与大模型厂商双重绑定的模式功不可没。随着大模型厂商持续推进应用端布局,AI算力产业推理驱动逻辑将持续强化,联想集团这类企业的市场份额还有望进一步提升。
ASIC芯片引发的结构性变革
AI产业从模型竞争转向应用竞争的背景,是大模型进入相对成熟阶段,各厂商之间模型差距逐渐缩小,模型之间的竞争,也从整体参数能力的竞争,向差异化能力竞争转变。这就带来了ASIC芯片的崛起。
当大模型厂商们日益强烈地意识到,不同的大模型能力,需要使用不同的底层算力芯片训练,才能更好地达成,以英伟达为代表的GPU芯片在性能、通用性等方面的优势,正被谷歌TPU、亚马逊Trainium等ASIC芯片在定制化方面的优势削弱,因此后两者的市场份额开始逐步提升。这也是TrendForce预计基于ASIC的AI服务器,出货占比将提升至27.8%的核心逻辑。
近日,摩根大通在此前将谷歌TPU芯片2026年出货预期上调至200万颗的基础上,再次大幅上调至370万颗。可见,这一趋势已成为不同机构间,乃至整个市场的共识。
这一趋势对服务器厂商的最大考验,在于适配大模型厂商自研ASIC芯片的定制化能力。比如,亚马逊与其AI服务器硬件提供商联想集团的合作,就涉及AWS的定制化服务器供应。这些服务器通过与AWS的高度适配,为AWS的云计算基础设施提供稳定的服务器硬件支撑,并且双方的硬件合作还逐渐延伸到AI服务器领域。

一个时间上的“巧合”,正强化这种定制化模式优势。根据服务器3~5年的生命周期,全球范围内的新一轮通用服务器换机周期已正式启动,而定制化模式之下,大模型厂商与服务器厂商之间更强的用户粘性,将使得联想集团这类强定制能力厂商,成为原有大模型厂商客户换机的首选供应商。在通用服务器领域的高粘性,与在AI服务器领域的定制能力,成为联想集团这类厂商进一步抢占大模型厂商自研ASIC芯片服务器市场的并行“双翼”。
ASIC芯片崛起的另一个可能被忽略的原因是,在推理驱动的行业发展阶段,芯片性价比逻辑也开始显现。在训练驱动阶段,大模型厂商对模型性能升级速度的需求,反映到芯片层面则为算力性能需求。而在推理驱动阶段,这一需求开始减弱。当推理需求以前述15倍甚至更大规模扩张时,大模型厂商的成本压力开始放大,并逐步淹没对性能的需求。
特别是在当前AI算力基础设施建设的能源瓶颈,导致美国电价暴涨,政府推动大模型厂商承担更多电力成本的背景下,芯片作为算力基础设备能耗的重要组成部分,也将更强调使用成本。
高盛近日发布的AI芯片研究报告指出,从TPU v6升级至TPU v7,谷歌芯片在系统层面的综合成本,已优于英伟达。研报据此认为,未来AI算力芯片将呈现出GPU继续主导训练与通用算力市场,而定制ASIC在规模化、可预测的推理负载中不断渗透的趋势。
而对服务器厂商来说,芯片厂商之间这种围绕成本竞争的逻辑将同样适用。因为对大模型厂商来说,推理成本的降低并非芯片单环节的事,而是包括芯片、服务器、算法等等各个环节在内,整个算力产业链的系统化工程。其中服务器散热作为占据数据中心能耗30%~40%的环节,将成为推理成本降低的重要发力点。
在2025/26财年第二季度财报中,联想集团公布,其海神液冷技术业务收入同比暴增154%。这不仅是联想集团在服务器液冷领域技术优势的彰显,也是对前述大模型厂商推理阶段降本逻辑的一个实证。2025年,联想集团新推出“飞鱼”仿生散热设计与“双循环”相变浸没制冷系统两大服务器散热技术创新,显然也是公司对这一行业发展新逻辑的重视与回应。

综合来看,2026年的服务器市场竞争,已经从单纯的产品竞争,向更多维度能力的系统化竞争升级。服务器厂商不仅要拥有高性能、低成本的服务器产品,还需具备强大的大模型厂商适配能力,长期的绑定粘性,并在算力、应用等更多产业链环节建立更出色的行业洞察与布局,并将这些洞察与布局落地成为对大模型厂商的业务赋能。行业高速增长的同时,联想集团等具备系统性能力的厂商,也正在市场格局演化中,不断兑现其稀缺性价值。
相关文章
- AMD服务器CPU市场份额最近7年增长了28%,英特尔的市场份额跌至72%
- 勤哲Excel服务器:让实验室数据采集与报表生成高效可控
- 勤哲Excel服务器:构建水电站运行管理新体系,赋能高效安全运营
- AMD与英特尔或将服务器CPU价格上调15%,因超大规模数据中心建设已耗尽库存
- 苹果自研服务器芯片据称将于2026年下半年投入量产
- 勤哲Excel服务器:以数据可视化驱动精细运营 赋能塑料制品企业管理升级
- 勤哲Excel服务器: 重塑管理确定性,为企业构建可进化的数字化管理体系
- 勤哲Excel服务器:夯实财务数字化底座,重塑企业精细化管控能力
- 勤哲Excel服务器:助力数字化转型国产化替代,保障政企数据安全可控
- 智能制造新时代:勤哲EXCEL服务器助力制造业实现信息化转型与效率革新
- 英特尔14A制程受到青睐,英伟达与AMD或将考虑其服务器CPU采用该制程
- 勤哲Excel服务器:移动办公的革新利器,显著提升企业协作效率
- 苹果人工智能服务器芯片Baltra或将用于执行人工智能推理任务
- 请速查!React炸弹级漏洞或致企业服务器完全沦陷,南凌科技云WAF筑起坚实防线
- 勤哲Excel服务器:赋能企业,重掌数字化系统自主权
- 勤哲Excel服务器实现五金制造企业管理系统









