英伟达发布开源AI模型Neomotron 3 Nano Omni,性能提升高达9倍
2026-04-29 05:59:51AI云资讯1589

(AI云资讯消息)4月28日,英伟达发布的Nemotron 3 Nano Omni是一款开源多模态模型,将这些能力整合于单一系统之中,使智能体能够跨视频、音频、图像和文本进行高级推理,提供更快、更智能的响应。这一顶尖模型为企业与开发者打造了一条生产路径,能够构建更高效、更精准的多模态AI智能体,同时具备充分的部署灵活性和掌控力。
Nemotron 3 Nano Omni为开源多模态模型树立了全新的效率标杆,凭借领先的准确率与低成本,在复杂文档智能、视频及音频理解等六项权威榜单中拔得头筹。
已采用Nemotron 3 Nano Omni的人工智能及软件公司包括Aible、应用科学智能(ASI)、Eka Care、富士康、H Company、Palantir和Pyler,此外,戴尔科技、DocuSign、Infosys、K-Dense、Lila、甲骨文和Zefr也正在对该模型进行评估。
Nemotron 3 Nano Omni 在其 30B-A3B 混合专家架构中融合了视觉与音频编码器,无需再使用独立的感知模型,从而大幅提升大规模推理效率。在保持高效率的同时,该模型还具备出色的多模态感知精度,使 AI 系统能够在同等的交互水平下,实现比其他开源全模态模型高出 9 倍的吞吐量。这意味着在不牺牲响应速度或质量的前提下,降低成本、提升可扩展性。
在智能体系统中,Nemotron 3 Nano Omni 可与专有云端模型、英伟达其他Nemotron 开源模型(如用于高频执行的 Nemotron 3 Super 或用于复杂规划的 Nemotron 3 Ultra)以及其他供应商的专有模型协同工作,为计算机操作、文档智能和音视频推理等智能体工作流中的子智能体提供支持。
计算机操作智能体——Nemotron 3 Nano Omni 为导航图形用户界面的智能体提供感知循环支持,能够对屏幕内容进行推理,并随时间推移理解用户界面的状态变化。H Company 最新的计算机操作智能体由 Nemotron 3 Nano Omni 驱动,采用 1920×1080 像素的原生输入分辨率,实现高保真视觉推理。在 OSWorld 基准测试的初步评估中,这一集成方案在导航复杂图形界面方面实现了显著飞跃,并充分发挥了 Nemotron 3 Nano Omni 处理超高分辨率图像的能力。
文档智能——能够解读文档、图表、表格、截图及混合媒体输入,使智能体能够连贯地跨视觉结构和文本内容进行推理。这对于企业分析和合规工作流至关重要。
音频与视频理解——在客户服务、研究和监控工作流中,Nemotron 3 Nano Omni 能够保持音视频上下文,将所说的内容、所显示的内容和所记录的内容整合为统一的推理流,而非割裂的摘要。
相关文章
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 英伟达CEO黄仁勋庆祝GeForce 3问世25周年:没有GeForce,就没有AI
- 英伟达发布Nemotron 3 Super开源智能体AI模型:或成为OpenClaw的理想选择
- 英伟达CEO黄仁勋将AI比作一个五层蛋糕,称其潜力尚未被完全发掘
- Teclab绕过英伟达RTX 50显存时钟限制,将RTX 5070 Ti超频至超过36Gbps
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达将推出新款GeForce RTX 5050显卡,搭载9GB GDDR7显存
- 英伟达将向两家光子技术公司注资40亿美元,抢占AI竞争制高点
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









