青云 QingCloud合作伙伴无问芯穹分享:加速大模型落地的最后一公里
2023-11-17 11:35:36爱云资讯1202
青云科技聚焦 AI 算力调度等能力,通过开放生态,联合 AI 硬件及软件供应商、算法模型服务商、各地不同规模的算力服务商以及行业应用服务商等,深度融合算力、算法、行业数据以及场景应用能力,让 AI 真正能释放出业务价值。
因此,青云科技 AI 算力发布会邀请了生态合作伙伴共同分享对于 AI 落地应用的技术与实践。无问芯穹商业化副总裁李枫以《加速大模型落地的最后一公里》为主题发表精彩演讲,分享了无问芯穹在大模型落地方向的探索和进展,以下为演讲全文,经整理:
最近大模型在文本对话、图像生成等 AI 内容生成领域上取得优异的性能,标志着 AI 2.0 时代的来临。
如上图所示的例子:微软 Copilot 显著提升办公软件 Office 的效率。比如我们输入一个话题,程序可以自动生成相关的问题描述与日程安排;Midjourney 的图像生成功能,使我们可以给给出描述文字得到自动生成图片,同时能实现图中所示的缩放功能。
在 AI 2.0 时代,大模型正引导了一轮巨大的技术变革,这几个视频都展示了大模型已经能服务生产对话、代码生成,而这些能力未来将赋能千行百业的技术。然而面对大模型这样的重要技术突破,我国却在算法层和算力层都受到了限制,包括最先进的模型调用被拦截、最先进的芯片被美国限制出口,因此国产化是 AI 2.0 时代突围的必经之路。
我们可以看到国内外生态差异非常明显,国外针对不同的算法模型,英伟达提供了统一的算力平台和 Cuda 的软件生态。反观国内的多种大模型、多套硬件平台导致用户难以实现高效统一部署,因此,算法模型和硬件平台的适配成为生态和落地的最大瓶颈。
为了解决模型和算力之间的瓶颈,无问芯穹致力于提供大模型软硬一体化自动化优化方案。向上,我们服务多家大模型算法企业。向下,我们联动多家国产芯片公司。产品上,我们实现了大模型在多种硬件上的 M×N 一键部署平台,降低大模型的使用门槛,让模型部署越快越好,真正成为 AI 2.0 时代大模型的基础设施。
最后,为了助力 AI 2.0 时代大模型落地,无问芯穹着力于解决四个痛点需求:
1、支持长文本或大输入
比如之前支持 2K token 的模型,我们可以用快速推理和训练,使它支持 32K token,我们就可以做好例如专业长文本的信息检索、生成、会议聊天助手等应用。
2、提升性价比
我们把语言和多模态生成模型部署到消费级显卡,甚至手机等终端设备上,让广大客户用得起。
3、垂直领域适配
用大模型通用能力帮助各行各业的人们提升体验和效率。
4、一键式部署
让大模型能低人力成本被部署到各种场景,让每个工厂、学校、家庭甚至个人都能用到它的能力。
希望无问芯穹能真正满足客户的实际需求,解决好大模型落地的最后一公里。再次感谢青云科技的邀请,无问芯穹希望携手青云科技共创 AI 新纪元。
相关文章
- RAGFlow调用DeepSeek,青云科技让用户轻松突破智能检索、知识管理难题
- 常青云与华瑞指数云达成战略合作:构建全栈国产化AI Infra生态,引领产业智能化变革
- DeepSeek 破局,青云QingCloud分享 AI 赋能智能制造
- 青云AI算力云上线万相 Wan2.1-T2V 模型,开启文生视频新体验
- 青云QingCloud KubeSphere 企业版 v4.1.3 发布,管理策略更灵活更安全
- 青云科技 AI 应用开发平台开启公测,一站式构建企业级应用
- 接入DeepSeek大模型!青云科技助力鼎和保险的专属AI助手正式上线!
- 671B 满血 DeepSeek-R1 上线!青云科技一文教你如何创建自己的 AI 应用
- 青云科技参与北京市科委重点项目,助力京蒙算力智能调度
- 青云科技发布 2024 业绩预告,净利润增长 42.43%
- 青云QingCloud入选 CSDN 2024 中国开发者影响力年度榜单
- 青云QingCloud收到中国信通院感谢信
- AI 时代,青云科技与曙光存储携手布局数据航海图
- 青云科技入选“新智榜单”——人工智能应用标杆 TOP100
- 青云科技作为重点厂商入选甲子光年《中国 AI 算力行业发展报告》
- 深度融合华为昇思,青云科技智算通过昇腾兼容性认证