天数智芯联合无问芯穹完成智铠GPU百卡推理集群测试与适配,支持多场景大规模实时推理
2024-12-09 14:18:10爱云资讯13000
近日,天数智芯与无问芯穹达成重要合作,在天数智芯智铠GPU百卡推理集群上成功部署了无问芯穹Infini-AI异构云平台,并实现了多种主流大模型在该推理集群上的全功能适配,并正式对外提供MaaS服务。双方此次合作,旨在协力构建一个以自主芯片为核心的大模型服务生态,进一步推动我国人工智能产业的快速发展。
Infini-AI异构云平台是无问芯穹开发的一个基于多芯片算力底座的一站式大模型开发与服务平台,它打破了传统计算资源的限制,实现了对多种模型和计算卡的全面支持。
天数智芯自主研发的智铠100GPU,支持多种精度数据类型,灵活支持各种模型算法,兼容国内外主流AI生态,满足从基础研究到实际应用的全方位需求。
早在2024年7月,无问芯穹Infini-AI异构云平台就与天数智芯合作,打造了可进行单任务千卡规模异构芯片混合训练的大模型训练平台,千卡异构混合训练集群算力利用率最高达到了97.6%。
在本次合作中,经过双方严格的功能和性能测试,完成了智铠100 GPU产品与无问芯穹Infini-AI异构云平台的全面接入。该集群可灵活支持对话问答、数据标注、内容理解与分析,信息抽取等主流任务场景,满足文本、图片、视频等多场景下的大规模实时推理需求。当前,智铠100现已在无问芯穹Infini-AI异构云平台上线,可支持7B-72B参数的模型推理,用于更佳效果的数据生成与处理。Infini-AI是高性能算力和原生工具链平台,其中大模型服务平台可为应用开发者提供各种高性能、易上手、安全可靠的大模型服务,能力覆盖从大模型开发到大模型服务化部署的全流程。现已收录包括Stable Diffusion、Qwen2.5、CogvideoX、Llama3.1在内的多种主流大模型,支持模型一键微调部署、模型与ComfyUI workflow托管等功能。
平台用户可以屏蔽硬件生态影响,通过极少步骤操作调用各种模型API,实现模型的快速部署。同时,还能享受到与国际主流产品相比,具有更高性价比的算力服务。随着人工智能技术的快速发展及应用场景的拓展,国内大模型技术与应用企业对高可控性、高效能、高性价比、高附加值的算力需求日益迫切。双方此次合作极大地降低了AI应用的技术门槛和使用成本,更为自主芯片在人工智能领域的广泛应用开辟了新的道路。展望未来,天数智芯与无问芯穹将继续全面合作,在智算中心、央国企、互联网等领域,共建AGI时代的大模型算力基座、探索并推动应用普及和创新发展、加速行业的数字化转型步伐。
相关文章
- 从智能优化到全栈架构:超云AI推理算力技术实力解析
- OpenAI启动为期12天shipmas活动,期间将上线Sora和新的推理模型
- 星凡科技,推理算力产品领航者
- OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
- 神州鲲泰打造昇腾能力中心,携手伙伴共赢AI推理新机遇
- 相芯出席英特尔 OpenVINO DevCon中国系列工作坊大会,畅谈数字人本地化推理
- OpenAI推出首款具有推理能力的模型o1
- 商汤大装置加码“算电一体化协同”,推理性能提升4倍!
- 云天励飞论文入选ACL24:SPACE引擎引领大模型推理无损加速时代
- 云天励飞推出全新云端推理加速卡X6000,夯实智算运营底座
- 华为联合WPS AI,见证昇腾大模型推理应用启航
- 当《开心消消乐》遇上 AI 推理,我们找到了高质量关卡背后的原因!
- 昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理
- 「超星未来」完成数亿元Pre-B轮融资,加码边缘侧大模型推理芯片
- 联发科天玑9300+支持AI推测解码加速技术,推理性能大突破
- 昆仑万维旗下Opera全新AI服务器集群成功落地 大模型推理速度提高30倍