商汤大装置“解题”人形机器人,一段式端到端开启具身智能的奇点时刻
2024-09-20 22:01:58爱云资讯12236
作为国内AI基础设施服务的领导者,商汤大装置将为推动人形机器人的技术创新与应用,提供领先的算力、模型和数据处理能力支撑。
在本周举办的第二届中国具身智能与人形机器人创新发展大会上,商汤科技大装置事业群生态总监刘远辉分享了商汤在AI和自动驾驶领域的创新实践对于具身智能、人形机器人的借鉴价值。他指出,AI基础设施将是驱动人形机器人端到端发展的新引擎。
一段式端到端AI系统
开启人形机器人通往AGI之路
过去十年间,AI技术已在多个垂直领域突破了工业红线,成功与各行业的实际应用场景融合,但其发展仍面临诸多挑战。比如,各行各业中的长尾场景众多,但需求规模小,而大规模的研发投入又会导致投资回报率降低。此外,行业中的AI模型种类众多,但单一模型能够解决的问题仍十分有限。
机器人的发展也呈现近似趋势。大多数机器人产品仅局限于执行单一、特定的任务,缺乏足够的通用性和泛化能力,成为广泛普及与应用的一大障碍。
商汤在端到端自动驾驶大模型方面的创新研发实践,为具身智能、人形机器人的突破提出了可以借鉴的新路径。
传统的自动驾驶系统由多个感知小模型和规则定义的规控系统组成。在2022年底,商汤及其联合实验室提出了行业首个感知决策一体化自动驾驶通用模型UniAD,将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型中。
UniAD作为“一段式”端到端的代表,相较于业内其他将感知和规控分为两个模型的“两段式”端到端方案,能够实现感知信息的无损传递,拥有更好的复杂场景理解、泛化能力和解决corner case的能力。
“一段式”端到端系统完全由数据驱动,其能力将随着训练数据量的增加而实现跃迁,让自动驾驶系统和人形机器人拥有更通用、更泛化的复杂场景理解能力,有望创造自动驾驶和具身智能发展的“ChatGPT时刻”,开启自动驾驶和人形机器人通往AGI之路。
而“一段式”端到端系统的训练,需要更高算力、全新数据生产管线、世界模型等作为平台支撑,带来了对人工智能基础设施需求的激增。
商汤大装置+日日新大模型体系
为具身智能打造新一代AI基础设施
商汤对人工智能基础设施的定义,源于AI发展的三要素:算力、算法和数据。
充足的算力资源储备,强大的基模型、AI平台软件和数据能力优势,以及面向场景生态的AI专家服务体系,是AI基础设施成功的关键要素。
在算力层面,商汤大装置运营总算力规模已突破20,000 PetaFLOPS,同时也在积极“云、边、端”协同的算力布局,以更高的算力利用率,为人形机器人的应用提供更高推理性价比。
根据IDC发布报告《中国智算服务市场(2023下半年)跟踪》,商汤科技在中国云计算基础设施厂商中脱颖而出,与火山引擎、阿里巴巴共同跻身2023年下半年中国GenAI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队。
在算法层面,商汤的“日日新”大模型体系在尺度定律下快速迭代。最新的“日日新5.5”在语言能力、多模态能力已全面对标GPT-4 Turbo和GPT-4o,可赋能人形机器人的“眼力”和“脑力”。
作为国内首个具备流式原生多模态交互能力的大模型,“日日新5o”实现了语音、视频和语言模型的原生融合,响应延迟达到560ms,能够满足人形机器人实时的流式多模态AI交互能力需求。
同时,商汤端到端AGI大模型,让机器人能够像人一样理解复杂的现实世界,提升各种环境下的交互和决策能力。比如,在自动驾驶场景中,该模型可以让车辆平稳通过路障限宽路段,胜任传统规则系统无法应对的场景。
具身智能发展的关键,正是多模态大模型能力与人形机器人的有效结合。
在数据层面,通过虚实结合的方式进行数据生成,可以解决人形机器人开发广泛存在的数据匮乏乃至标准不统一等难题。
对此,商汤正与行业伙伴联合开发仿真模拟方案,通过商汤大模型和新型AI基础设施加速仿真场景生成,提升开发效率。
此外,商汤大装置紧密联动机器人产业上下游软件及硬件合作伙伴,如人形机器人国创中心、松应科技、北京银河通用机器人等,发挥商汤在算力及算法层的优势,共同探索具身智能行业应用与实践,助推人形机器人产业新一轮升级。
在人形机器人的浪潮下,商汤将坚定基础设施的行业定位,基于商汤大装置和日日新大模型体系,提供算力、数据、模型能力的全栈支持,加速人形机器人的一体化定制化研发和落地,构建机器人智能体的全新行业生态。
相关文章
- 商汤大装置联合发布“算电协同平台”,建设绿色智算中心“样板间”
- 商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
- 曦望与商汤科技、无极资本达成战略合作,共拓中国AI算力生态新高地
- 商汤董事长兼CEO徐立:人工智能的十年演进
- 值得买科技与商汤科技达成战略合作,共聚WAIC探索消费智能体新机遇
- 商汤发布「悟能」具身智能平台:4D 真实世界构建,让机器人“看懂、会动、能交互”
- 商汤科技即将发布“日日新6.5”,多项产品升级驱动生产力革新和交互升级
- 商汤×华东院达成“AI+建筑”战略级合作,70年智慧焕发“日日新”
- 商汤科技计划进军具身智能:核心团队已初步组建完毕
- 商汤科技将在2025WAIC发布日日新6.5大模型及具身智能平台
- 中韩科技对话再升级,韩国高规格代表团到访商汤科技
- 全球AI人才榜首次曝光,何恺明登顶师承汤晓鸥,商汤王晓刚、石建萍上榜
- 国内首家!商汤科技大装置万象获得中国信通院“大模型推理平台”最高评级认证
- 云知声与商汤科技达成战略合作 推动多模态智能交互协同进化
- 商汤科技与云知声达成战略合作 推动多模态智能交互协同进化
- 想法流x商汤科技大装置:端到端全栈赋能,造就现象级应用
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>- 兼顾纤薄、耐用与可持续 Galaxy Z Flip7展现三星卓越的产品设计能力
- 新石器无人车部署超7500辆,成全球最大规模无人车队
- 未来式智能亮相 WAIC 2025,以人机协同范式引领产业智能变革
- 全球首例!康诺思腾手术机器人完成临床场景下自主手术验证,研究成果登上顶级期刊《Science Robotics》
- 超能AI+折叠大屏 新一代三星Galaxy Z Fold7|Z Flip7邂逅沈阳
- 技嘉 M27Q2 QD 高清2K 量子点电竞显示器正式上市
- 新型Xsens Avior OEM IMU,体积小、重量轻,可在苛刻的工作条件下提供高精度和高稳定性
- 从 “认知优势” 到现实赋能:DPVR AI Glasses 重构智能穿戴价值