禁令解除72小时:141GB H20 跑满血实测,DeepSeek 性能超预期
2025-07-18 11:20:27AI云资讯4716
2025 年 7 月 15 日,英伟达 CEO 黄仁勋宣布了一个震动 AI 圈的消息:美国政府即日起解除 H20 芯片对华销售禁令,而就在禁令解除后,云工场科技发布详细测试数据--- 8 卡 141GB 显存的 H20 服务器,能流畅运行 671B 参数的满血版非量化 DeepSeek-R1 模型,推理吞吐量突破预期。
硬核实测:141GB H20 跑满血版非量化 DeepSeek 性能全面解析
测试环境配置

一. 测试数据


二. 关键性能测试结果
测试显示:
1.首 token 响应快: 在测试的多个并发量下,首个 Token 的响应时间 (TTFT) 都保持在3秒以内(实测 0.1s - 2.8s),用户体验非常流畅,感觉不到任何延迟。
2.高并发吞吐大: H20 显卡展现出优秀的并发处理能力。在模拟 100 个用户同时提问(并发请求=100)的中高负载场景下:
·处理短问题(输入/输出各 256 tokens),系统总吞吐量高达 约 1124 tokens/s。
·处理典型问题(输入/输出各 1K tokens),总吞吐量稳定在 约 1100 tokens/s。
·处理复杂问题/长对话(输入/输出各 2K tokens),总吞吐量仍能保持 约 1020 tokens/s。
分场景性能趋势:
1.低并发场景 (<10 用户):
·响应极快: TTFT 始终低于 0.9 秒,用户几乎感觉不到等待。
·吞吐未饱和: 系统能力远未被充分利用,吞吐量相对较低(32-208 tokens/s),性能表现轻松自如。
2.中高并发场景 (50-100用户):
·响应依然迅速: TTFT 保持在 1.9 秒 (1K上下文) 到 2.8 秒 (2K上下文),交互体验依然流畅。
·吞吐大幅跃升: 系统资源得到高效利用,总吞吐量急剧上升至 634 - 1124 tokens/s。
·长上下文优势显现: 在相同并发下,处理更长(1K/2K)的上下文通常能获得比短上下文(256)更高的吞吐量(尤其在并发50时最明显),充分体现了 vLLM 对长文本的优化效果。
3.极限场景 (100用户 + 长上下文 2K):
·响应可控: TTFT 为 2.8 秒,交互体验依然流畅。
·吞吐维持高位: 即使在此压力下,系统总吞吐量仍达 1020 tokens/s。
三.测试总结

云工场科技构建了全面的异构计算资源池,涵盖 NVIDIA 全系高性能 GPU(包括 141GB 显存 H20、L20、RTX 4090 等最新型号)、AMD w7900 以及国产算力三巨头(华为昇腾 910B 系列、百度昆仑芯 P800、燧原 S60)等等,可本地部署到就近机房,提供 DeepSeek、文心一言、华为盘古、LLaMA 等开源大模型本地部署。
通过严格的横向性能基准测试,云工场科技验证了不同架构 GPU 在 LLM 推理、计算机视觉等场景的能效比差异,并为客户提供"算力租赁 + 算力智能调度 + 平台化交付"的完整 AI 服务体系,目前已在教育/工业/通信/交通等多领域成功落地,支撑其大模型部署、推理及场景化落地的全流程需求。

相关文章
- 做表格AI又升级了!数以轻舟Agent V3.2:当Deepseek V4 Pro遇上百万
- 时的科技黄雍威:载人eVTOL已成为新势力,进入下一个DeepSeek时刻
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 追觅硅谷发布的高光时刻:中国智造Deepseek时刻已经来临 商业范式面临巨大变革
- 国产算力×国产模型,联想开天工作站全面适配 DeepSeek V4!
- 金融智能新跨越:中国银联依托昇腾算力率先完成DeepSeek-V4私有化部署
- 探索“数算模用“一体化发展,超算互联网加速DeepSeek V4赋能千行百业
- 显示龙头卡莱特完成DeepSeek V4在昇腾平台验证,国产大模型工程化落地提速
- 超算互联网推出限时免费DeepSeek-V4对话服务 零门槛解锁百万Token体验
- DeepSeek-V4 上线国家超算互联网:以普惠算力与开发者共逐AI新浪潮
- 每日互动个知·智能工作站率先接入DeepSeek-V4
- 元戎启行冲刺百万级交付,前DeepSeek核心成员阮翀将亮相北京车展
- “马”上有Token,联通云“万亿”免费送!——联通云×OpenClaw+DeepSeek,零成本解锁灵活办公新方式
- 开箱即用、安全无忧!麒麟信安全国产化智算一体机发布,高效赋能DeepSeek大模型应用实践
- DeepSeek最火Engram怎么跑?英特尔至强+AMX实测:性能提升达1.67倍!
- “工业版DeepSeek”,安世亚太精智 iGPT 工业大模型平台荣获国家工业大模型最高评级
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









