OpenAI首次采用Cerebras的AI芯片运行Codex模型,成功实现了每秒1000次事务处理量
2026-02-14 09:17:53AI云资讯4430

(AI云资讯消息)Cerebras的AI芯片首次获得主流采用,而采用者正是OpenAI。OpenAI透露,他们最新的Codex模型除了使用英伟达的算力外,还增加了另一家算力供应商。
在最新的Codex版本发布中,OpenAI透露,GPT-5.3-Codex-Spark模型正是由Cerebras的AI芯片提供动力,使用该硬件相比其他方案的优势在于推理任务中的低延迟。在此次算力选择中,OpenAI间接宣告了在推理领域出现了一个可以抗衡英伟达的对手。
主流Codex模型与这里的Spark变体之间的区别在于,OpenAI称设计目的在于即刻完成工作。通过优化流程管道,借助Cerebras的硬件,GPT-5.3-Codex-Spark在模型延迟方面取得了重大改进。OpenAI声称,此版本将首字生成时间即从输入到输出第一个字的时间缩短了50%,这无疑是一个惊人的数据。Codex-Spark运行在Cerebras的晶圆级引擎3(Wafer Scale Engine 3)上。晶圆级引擎3采用台积电5nm制程节点,AI优化的可编程处理核心架构,约有4万亿晶体管数量,90万个AI优化核心,内存带宽达21PB/s,属于完整的300mm晶圆级芯片。
至于OpenAI为何选择Cerebras作为此次的算力供应商,原因有多方面。但其中最重要的一点是,借助晶圆级引擎3,OpenAI获得了惊人的内存带宽,这对于编码这类内存密集型任务至关重要。这也是为什么Codex-Spark能够实现每秒1000次事务处理,据称其响应速度可以媲美人类结对编程伙伴的原因。考虑到Blackwell架构更侧重于批量处理而非低延迟,若在英伟达的基础设施上训练Spark模型,在经济上并不划算,而这正是Cerebras在此场景下更具优势的原因。
当然在大规模推理方面,英伟达在Token经济中还是占据主导地位。英伟达Blackwell架构已将Token成本降低多达10倍。OpenAI的萨钦·卡蒂(SachinKatti)表示,与Cerebras的合作是为了增加互补能力,但在OpenAI的算力竞赛中,其核心忠诚度仍然完全倾向于英伟达。不过,通过Codex-Spark可以清晰地看到,当前的瓶颈在于延迟。而在硬件层面,英伟达的技术栈并未准备好主导这一领域。
鉴于Cerebras只是该领域内一个强大的竞争对手,此外还有来自ASIC制造商以及像AMD这样的竞争者所提供的新兴解决方案,看看推理市场未来将如何定位英伟达,只能拭目以待了。相关文章
- OpenAI的Codex已集成到ChatGPT移动应用程序中
- 奥尔特曼称,马斯克离开OpenAI提振了公司的士气
- OpenAI 新模型密集更新,Meta/微美全息强化布局AI核心需求迎爆发增长!
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- ChatGPT下载量放缓,或将影响OpenAI的首次公开募股
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- OpenAI正式发布GPT-5.5模型,编程能力大幅增强
- OpenAI Sora团队负责人比尔·皮布尔斯即将离职
- OpenAI对Codex进行大更新,直接瞄准了Claude Code
- OpenAI疲于应对公众争议、战略调整以及日益激烈的竞争的局面
- OpenAI收购科技播客节目TBPN,进入媒体赛道
- 大英百科全书起诉OpenAI,指控ChatGPT输出的内容与其几乎完全相同
- OpenAI新模型发布,Meta/微美全息以AI芯片+模型布局加速行业创新进程
- OpenAI发布GPT-5.4模型:具备原生计算机使用能力,能够在各类应用中执行任务
- OpenAI宣布获得亚马逊、英伟达和软银新融资1100亿美元
- OpenAI首次采用Cerebras的AI芯片运行Codex模型,成功实现了每秒1000次事务处理量
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









