基石智算CoresHub模型推理服务再升级!第三方平台下载模型可一键部署、推理
2025-06-11 17:17:31AI云资讯1313
基石智算CoresHub 全面升级了模型推理服务!用户可在魔搭、huggingface 等下载模型到基石智算,通过模型推理服务进行一键部署推理服务,并对外提供 API 能力,也可经过基石智算的模型调优进行二次训练后再部署。
推理过程中可以根据业务的并发量,进行推理服务的弹性扩缩容,提高业务运行效率的同时,节省算力成本。
以下是通过模型推理服务一键部署模型的详细步骤,以魔搭下载的模型为例:
一、从魔搭下载模型到文件存储
1.创建存储目录。

2.创建一个用于传数据的无卡启动实例,挂载文件存储。

3.在 Web 连接窗口中输入如下命令:

4.查看魔搭中的“模型文件—模型下载—下载”命令,使用 Git 下载

在 Web 连接中继续执行以下步骤:

如果模型中有大文件,并且大文件下载失败,可以执行以下代码:

二、模型部署
1.到“模型管理”添加模型。

选择已下载的模型。

输入模型名称等信息,选择部署方式。


2.部署模型

选择部署方式,支持单节点和多节点部署。

选择资源类型。

部署成功后,点击服务 ID 即可查看服务信息、服务监控、服务日志。


3.支持扩容
当推理服务需要满足更高并发时,可以通过增加推理实例的数量,以满足业务的高并发需求。
假设 1 张 4090 可以满足 DeepSeek-R1-1.5B 最高 100 的并发数量,当业务并发超出 100,可以增加到 2 个 4090 的 1 卡实例进行模型部署。

三、模型调用
1.使用第三方客户端 Cherry Studio 调用为例,开启第三方工具,点击界面左下角的设置图标,选择模型服务 > 添加。

2.在弹出添加提供商窗口中,配置各项参数,点击确定。

3.新添加的提供商已显示在列,配置相应的 API 密钥和 API 路径,并点击管理,对应的密钥和 API 地址在服务信息中。


4.配置模型名称。

5.在 CherryStudio 平台,点击左侧导航栏中的聊天助手,在对话框的顶部,切换已添加至平台上的模型,即可对话。

相关文章
- 天罡智算推出OPC园区赋能平台 助力园区打造“一人公司“孵化新标杆
- 中国移动发布原创智算互联技术及全球首台百T级智算互联设备样机
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 九章智算云平台上线OpenClaw 开启AI智能体云端部署新模式
- 开箱即用、安全无忧!麒麟信安全国产化智算一体机发布,高效赋能DeepSeek大模型应用实践
- 梦网云智算与知料科技达成合作,携手推动数智人技术商业化发展
- 睿思智联获昇腾 Atlas 800T/800I A3 认证:从 “能用” 到 “好用” 定义国产智算精细化管理新标准
- 基石智算升级Clawdbot安全性:彻底摆脱 AI Agent 安全隐患
- 荣誉加冕丨科士达“ 创新技术 ”再获权威认证,赋能AIDC绿色智算基石
- 韩智敏:软通华方开启“一个新品牌的第30年”,与伙伴共赴智算星辰大海
- Aginode安捷诺发布《工业智算网络技术白皮书》,推动智能制造网络升级
- 科士达全栈智慧能源方案赋能 AIDC 绿色智算
- 我国首部大模型国家标准实施,天翼云推动智算服务标准化
- 金山云星流全面升级 以智算穿越云上AI新周期
- 青云智算× TCL:荣获 2025 年度 AI Infra 领先企业
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍









