腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座
2025-06-09 18:06:05AI云资讯2242
随着生成式AI技术的爆发式增长,AI大模型开始渗透至手机领域,一线厂商已经把AI应用集成到各自最新的产品中,并且在以惊人的速度迭代。为了进一步提升大模型部署的效能,荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,并应用荣耀企业内部等场景,稳定性、可靠性、推理性能均大幅提升。
在推理平台场景中,荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后,在DeepSeek-R1 满血版场景下,相对于荣耀原始线上业务性能,TTFT(首Token 延迟)P95 的响应时间最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。在社区最新版本sglang场景下,TTFT P95的响应时间最高降低12.5倍。
腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显,主要的得益于多种投机采样技术核心能力:大语言模型的自回归解码属性无法充分利用GPU的算力,计算效率不高,解码成本高昂。而TACO-LLM通过投机采样的方式,从根本上解决了计算密度的问题,让真正部署的大模型实现“并行”解码,从而大幅提高解码效率。
荣耀大数据平台部相关负责人表示:“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座,部署稳定可靠,提升了性能加速体验。”
TencentOS Server AI加速版中提供的TACO-LLM加速模块,针对企业级AI模型私有化部署挑战,对大语言模型业务进行了专门的内核运行优化,用于提高大语言模型的推理效能,提供兼顾高吞吐和低延时的优化方案,能够“无缝”整合到现有的大模型部署方案中。
相关文章
- TVU Networks与腾讯云联合发布集成式云制播解决方案
- 腾讯云黄世飞:全面升级Data+AI能力,构建企业智能化数据基座
- 腾讯云TDSQL自研产品家族扩容,数据库AI服务正式发布
- 智慧星光与腾讯云深化战略合作,推进AI在认知智能与决策智能领域服务
- 腾讯云高级副总裁徐翊鸣:AI已成为金融机构提升生产力的“战略杠杆”
- 腾讯云面向全球发布智能体开发平台 3.0
- 2025腾讯云国际出海峰会:国际业务高双位数增长,海外客户规模同比增长翻倍
- “云+AI”深度融合,蘑菇车联携手腾讯云共拓MogoMind技术边界
- 赤子城科技与腾讯云达成战略合作,以AI驱动全球用户体验升级
- 腾讯云 TVP 走进太古可口可乐,共探数智融合下的企业增长新路径
- 2025腾讯全球数字生态大会定档9月16日 万兴科技拟出席腾讯云国际出海峰会
- 云原生应用保护能力获认可!腾讯云再次入选权威研报代表厂商
- 腾讯云论文入选数据库顶会VLDB 2025,REDSQL技术攻克NL2SQL难点
- IDC MarketScape:腾讯云位居国内生成式AI数据基础设施“领导者”象限
- AI时代,架构师如何破局成长?腾讯云架构师技术沙龙圆满收官
- 腾讯云与全球手游巨头Voodoo达成合作,共助小游戏品质升级









