基石智算CoresHub模型推理服务再升级!第三方平台下载模型可一键部署、推理
2025-06-11 17:17:31AI云资讯1464
基石智算CoresHub 全面升级了模型推理服务!用户可在魔搭、huggingface 等下载模型到基石智算,通过模型推理服务进行一键部署推理服务,并对外提供 API 能力,也可经过基石智算的模型调优进行二次训练后再部署。
推理过程中可以根据业务的并发量,进行推理服务的弹性扩缩容,提高业务运行效率的同时,节省算力成本。
以下是通过模型推理服务一键部署模型的详细步骤,以魔搭下载的模型为例:
一、从魔搭下载模型到文件存储
1.创建存储目录。

2.创建一个用于传数据的无卡启动实例,挂载文件存储。

3.在 Web 连接窗口中输入如下命令:

4.查看魔搭中的“模型文件—模型下载—下载”命令,使用 Git 下载

在 Web 连接中继续执行以下步骤:

如果模型中有大文件,并且大文件下载失败,可以执行以下代码:

二、模型部署
1.到“模型管理”添加模型。

选择已下载的模型。

输入模型名称等信息,选择部署方式。


2.部署模型

选择部署方式,支持单节点和多节点部署。

选择资源类型。

部署成功后,点击服务 ID 即可查看服务信息、服务监控、服务日志。


3.支持扩容
当推理服务需要满足更高并发时,可以通过增加推理实例的数量,以满足业务的高并发需求。
假设 1 张 4090 可以满足 DeepSeek-R1-1.5B 最高 100 的并发数量,当业务并发超出 100,可以增加到 2 个 4090 的 1 卡实例进行模型部署。

三、模型调用
1.使用第三方客户端 Cherry Studio 调用为例,开启第三方工具,点击界面左下角的设置图标,选择模型服务 > 添加。

2.在弹出添加提供商窗口中,配置各项参数,点击确定。

3.新添加的提供商已显示在列,配置相应的 API 密钥和 API 路径,并点击管理,对应的密钥和 API 地址在服务信息中。


4.配置模型名称。

5.在 CherryStudio 平台,点击左侧导航栏中的聊天助手,在对话框的顶部,切换已添加至平台上的模型,即可对话。

相关文章
- 亮相硅谷・智领全球:安世腾重磅发布全栈智算与通用具身智能解决方案
- 数翊科技出席第九届数字中国建设峰会,以dataeasy智算平台加速具身智能工业落地
- 基石智算上线Kimi K2.6,即刻体验高效智能体协作
- 云工场科技(02512.HK)落子无锡 携手沐曦股份+AMD双线发力国产智算新赛道
- 冷端可靠供冷,热端高效回收!海尔智算中心AIDC全场景方案赋能绿色算力生态
- Aginode安捷诺:OpenClaw开启的智能体浪潮,如何重塑下一代智算网络?
- Aginode安捷诺:当AI重塑算力格局,智算网络技术如何应对多维挑战?
- 基石智算上线 GLM-5.1,长周期智能体与高阶代码推理新体验
- 艾晨数能:以极致创新定义智算中心“动力心脏”,用硬核实力领跑模块化UPS新赛道
- “算网筑基 智领未来” 2024人工智能与智算应用发展研讨会在乌镇召开
- 上海交通大学:高校最大智算平台,“AI+科研、管理”协同创新
- “AI拉动云”飞轮效应凸显 金山云打开智算云增长天花板
- 全栈AIInfra护航,青云智算出席出海产业链研讨会
- 高工智算对话科士达:AIDC热浪下,基础设施供应商的冷静思考
- 智算云收入扛起大旗 AI时代金山云的想象空间有多大?
- 香港单体规模最大智算中心——中国移动环球智算中心开幕
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









