自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
2026-06-15 16:48:59AI云资讯1500
近日,2026北京智源大会召开。世界模型作为具身智能模型的最新范式,论坛吸引了广泛关注。自变量机器人联合创始人兼CTO王昊,分享了“事件驱动的世界模型”的前沿成果。
王昊表示,所有的智能都是在特定尺度下涌现出来的。需要找到不同模态各自表示的尺度,加上规模化,最终才能通向多模态基础模型。

过去在大语言模型上存在着“对齐税”,与之类似,目前训练世界模型的方式也需要付出“时间税”,这是以固定长度定义世界预测长度的弊端。
自变量近期发布的“事件级”世界模型WALL-WM,则使用以事件为边界拆分数据的方法,实现语言、视觉和动作的更好的对齐。自变量发现,事件是连接语言、视觉和动作的天然尺度:事件是基于语言表达,因此边界清晰;视觉也由事件分割,同一事件内的动作更容易预测。“以事件为尺度做变长分割,能够实现对三个模态的天然统一。”王昊表示。

以事件为数据边界训练的世界模型WALL-WM,也在多个测试上都取得了出色效果:
具身视频生成方面,在运动质量、语义一致性和物理合理性上,都超过WAN 2.1 / WAN 2.2;在隐式3D感知和多视角一致性上,全面优于目前开源视觉模型
;在真机测试方面,在基础任务、推理任务、灵巧任务、泛化任务等四大类操作评测benchmark上,分数大幅超过π 0.5、DreamZero。
据公开信息,自变量机器人是国内最早采用完全端到端路径,实现通用具身智能大模型的公司之一。其近期开源的VLA模型Wall-OSS-0.5,实现了在自研本体上部分任务仅需预训练、无需后训练,就能接近过去后训练微调后的零样本泛化水平。开源的数采方案XRZero-G0 则构建起一套软硬一体的全身无本体数采与训练系统,能将数据采集成本降低到过去的1/20。
相关文章
- 上海智位机器人正式加入鸿蒙生态,Mind+适配鸿蒙PC共推人工智能教育普及
- 大晓机器人完成天使+轮融资,已累计融资数亿美元
- 巅峰加冕|RoBoLeague机器人足球联赛全国争霸赛光谷收官,总冠军诞生!
- 端午新去处!重庆DDK 机器人潮玩嘉年华 打卡拍摄出行全指南
- 涂鸦智能×乐享科技,帮助机器人真正融入智慧家庭
- 解码AI未来 2026世界制造业大会人工智能与机器人展9月启幕
- 海柔闪攀机器人双深位升级方案中国首秀!为超密存储和更高效率护航
- 上海智位机器人(DFRobot) 发布 seeMote Cap 与 seeMote Cube,帮助 Apple Vision Pro 开发者把真实工具带入 visionOS 应用
- 华为云正式启动首届具身智能大赛,汇聚力量攻克机器人应用技术瓶颈
- From AI, For AI:艾利特如何让机器人成为AI产业的“关键推动者”?
- 双奖加冕丨深度探索协作焊接能力边界,珞石机器人亮相恰佩克盛会
- 全球首个!大晓机器人推出全屋三维可交互世界模型 Kairos-HomeWorld
- 上海智位机器人(DFRobot)C4002 毫米波雷达:全数据访问模式如何解决静态人体检测难题
- 亚马逊发布Proteus智能机器人,自动化升级伴随大规模裁员潮
- 智能如厕机器人“小伴”正式发布 跃伴助力无障碍科技建设
- 从“人找马桶”到“马桶找人”:跃伴智能如厕机器人亮相老博会
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









