腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座
2025-06-09 18:06:05AI云资讯2590
随着生成式AI技术的爆发式增长,AI大模型开始渗透至手机领域,一线厂商已经把AI应用集成到各自最新的产品中,并且在以惊人的速度迭代。为了进一步提升大模型部署的效能,荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,并应用荣耀企业内部等场景,稳定性、可靠性、推理性能均大幅提升。
在推理平台场景中,荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后,在DeepSeek-R1 满血版场景下,相对于荣耀原始线上业务性能,TTFT(首Token 延迟)P95 的响应时间最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。在社区最新版本sglang场景下,TTFT P95的响应时间最高降低12.5倍。

腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显,主要的得益于多种投机采样技术核心能力:大语言模型的自回归解码属性无法充分利用GPU的算力,计算效率不高,解码成本高昂。而TACO-LLM通过投机采样的方式,从根本上解决了计算密度的问题,让真正部署的大模型实现“并行”解码,从而大幅提高解码效率。
荣耀大数据平台部相关负责人表示:“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座,部署稳定可靠,提升了性能加速体验。”
TencentOS Server AI加速版中提供的TACO-LLM加速模块,针对企业级AI模型私有化部署挑战,对大语言模型业务进行了专门的内核运行优化,用于提高大语言模型的推理效能,提供兼顾高吞吐和低延时的优化方案,能够“无缝”整合到现有的大模型部署方案中。
相关文章
- 腾讯云以 99.8% 防护率通过AV-C年度评测
- 值得买科技与腾讯云深化“AI+消费”合作,首个消费决策Skills上线腾讯WorkBuddy
- 李未可AI眼镜成为腾讯云WorkBuddy首批生态伙伴,加速终端入口商业化落地
- 打破传统网络边界,飞猫引入腾讯云聚通加速能力破解游戏延迟难题
- 腾讯云ADP4.0发布:推出Claw模式,助力企业Agent规模化落地
- Agent进入“生产级”时代!腾讯云ADP4.0发布,打造企业级 AgentOps平台
- 未来智能与腾讯云达成战略合作,共筑AI Agent硬件与办公智能体新生态
- 腾讯云MongoDB获亚太游戏行业“三料第一”
- 双展联动!携手宝安区、腾讯云,洲明文博会硬核科技清单请查收!
- 腾讯云联合TC601提出国产 Data+AI平台五步转型路径
- 北京无限迭代与腾讯云和中国电信等公司共同荣获全球AI生态基石大奖
- 金山文档Skill、专家与连接器上架腾讯云WorkBuddy
- 腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路
- 东软智行与腾讯云达成战略合作 共筑AI智能座舱新生态
- 腾讯云与阶跃星辰达成战略合作,共塑大模型时代智能座舱新体验
- 腾讯云与赞同科技深化金融科技合作——技术研讨凝共识 装机实操促落地
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









