青云 QingCloud合作伙伴无问芯穹分享:加速大模型落地的最后一公里
2023-11-17 11:35:36AI云资讯1350
青云科技聚焦 AI 算力调度等能力,通过开放生态,联合 AI 硬件及软件供应商、算法模型服务商、各地不同规模的算力服务商以及行业应用服务商等,深度融合算力、算法、行业数据以及场景应用能力,让 AI 真正能释放出业务价值。
因此,青云科技 AI 算力发布会邀请了生态合作伙伴共同分享对于 AI 落地应用的技术与实践。无问芯穹商业化副总裁李枫以《加速大模型落地的最后一公里》为主题发表精彩演讲,分享了无问芯穹在大模型落地方向的探索和进展,以下为演讲全文,经整理:

最近大模型在文本对话、图像生成等 AI 内容生成领域上取得优异的性能,标志着 AI 2.0 时代的来临。

如上图所示的例子:微软 Copilot 显著提升办公软件 Office 的效率。比如我们输入一个话题,程序可以自动生成相关的问题描述与日程安排;Midjourney 的图像生成功能,使我们可以给给出描述文字得到自动生成图片,同时能实现图中所示的缩放功能。

在 AI 2.0 时代,大模型正引导了一轮巨大的技术变革,这几个视频都展示了大模型已经能服务生产对话、代码生成,而这些能力未来将赋能千行百业的技术。然而面对大模型这样的重要技术突破,我国却在算法层和算力层都受到了限制,包括最先进的模型调用被拦截、最先进的芯片被美国限制出口,因此国产化是 AI 2.0 时代突围的必经之路。

我们可以看到国内外生态差异非常明显,国外针对不同的算法模型,英伟达提供了统一的算力平台和 Cuda 的软件生态。反观国内的多种大模型、多套硬件平台导致用户难以实现高效统一部署,因此,算法模型和硬件平台的适配成为生态和落地的最大瓶颈。

为了解决模型和算力之间的瓶颈,无问芯穹致力于提供大模型软硬一体化自动化优化方案。向上,我们服务多家大模型算法企业。向下,我们联动多家国产芯片公司。产品上,我们实现了大模型在多种硬件上的 M×N 一键部署平台,降低大模型的使用门槛,让模型部署越快越好,真正成为 AI 2.0 时代大模型的基础设施。

最后,为了助力 AI 2.0 时代大模型落地,无问芯穹着力于解决四个痛点需求:
1、支持长文本或大输入
比如之前支持 2K token 的模型,我们可以用快速推理和训练,使它支持 32K token,我们就可以做好例如专业长文本的信息检索、生成、会议聊天助手等应用。
2、提升性价比
我们把语言和多模态生成模型部署到消费级显卡,甚至手机等终端设备上,让广大客户用得起。
3、垂直领域适配
用大模型通用能力帮助各行各业的人们提升体验和效率。
4、一键式部署
让大模型能低人力成本被部署到各种场景,让每个工厂、学校、家庭甚至个人都能用到它的能力。
希望无问芯穹能真正满足客户的实际需求,解决好大模型落地的最后一公里。再次感谢青云科技的邀请,无问芯穹希望携手青云科技共创 AI 新纪元。
相关文章
- 青云 AI Infra 3.0 :“CPU+GPU”统一架构决胜 AI Agent 时代
- 青云智算× TCL:荣获 2025 年度 AI Infra 领先企业
- 青云AI算力云上线MiniMax-M2.1,全球 SOTA 编程能力一键体验
- 破解高校智算三大难题,青云 AI Infra 3.0 覆盖教学科研全场景
- 聚焦 “AI+” 新时代,青云科技与沪上高校共探 AI 创新实践之路
- 青云科技副总裁沈鸥:AI Infra 3.0 让 AI 转型从“难题”变“红利”
- 青云科技 CEO 林源:AI Infra 3.0 以渐进式创新构建 AI 转型桥梁
- 青云 AI Infra 3.0 发布,让企业 AI 转型从 “焦虑” 到 “安心”
- 青云科技入选计算赋能新质生产力典型案例
- 青云AI算力云首登 AI Ping,刷新DeepSeek吞吐性能榜首
- 青云科技出席 2025 光合组织领导人大会,启动“强芯固基”计划
- 青云AI算力云上新 Qwen3-30B-A3B,大模型 API 一键调用
- 全栈 + 混合,青云QingCloud让低空经济“飞”更稳
- 青云科技与信通院、焱融启动 AI 推理场景高性能存储技术推进计划
- 青云携手珠海华发入选信通院 2025 可信云用户典型实践
- 青云科技入选信通院 2025 可信云技术典型实践
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









