英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍
最新 12 月 15 日消息,英伟达今日发布 Nemotron 3 开源模型系列,包括 Nano、Super 和 Ultra 三种规格,宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。

Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家(MoE)架构,帮助开发者大规模构建和部署可靠的多智能体系统。
英伟达表示,随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统,开发者面临着越来越多的挑战,包括通信开销、上下文漂移和高昂的推理成本。此外,开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron 3 直接应对这些挑战,提供客户所需的表现力和开放性,以构建专门化的智能体 AI。
早期采用者包括安永、思科、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys、Zoom、Accenture、Cadence 和 Cursor,正在将 Nemotron 家族的模型集成到 AI 工作流中,以推动制造业、网络安全、软件开发、媒体、通信等行业的应用。
开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 智能体,并加速从原型到企业部署的创新。
最新从英伟达官方获悉,Nemotron 3 的 MoE 模型系列包括三种规格:
Nemotron 3 Nano,一款小型的 30-billion-parameter 模型,每次激活最多 30 亿参数,适用于针对性强、高度高效的任务。
Nemotron 3 Super,一款高准确性的推理模型,拥有约 1000 亿参数,每个 token 最多激活 100 亿参数,适用于多智能体应用。
Nemotron 3 Ultra 是一款拥有约 5000 亿参数和每 token 最多 500 亿活跃参数的大型推理引擎,适用于复杂的 AI 应用。
Nemotron 3 Nano 宣称是目前计算成本效率最高的模型,专为软件调试、内容摘要、AI 助手工作流程和低推理成本的信息检索等任务进行优化。该模型相比 Nemotron 2 Nano 实现了高达 4 倍的 token 处理吞吐量,并将推理 token 生成减少了 60%,显著降低了推理成本。凭借 100 万 token 的上下文窗口,Nemotron 3 Nano 能记住更多信息,使其在处理长时间、多步骤任务时更加准确且具备更强的信息关联能力。
Nemotron 3 Nano 今日已在 Hugging Face 上线,Nemotron 3 Super 和 Ultra 预计将在 2026 年上半年推出。最新附开源地址:
https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8
《英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
首飞成功!我国彩虹7隐身无人机有多强 央视揭秘:堪称无敌
快科技12月15日消息,中国航天科技集团第十一研究院今日官宣,由该院研制的彩虹-7高空高速隐身无人机近日在西北某机场成功首飞!这标志着我国在高性能、高隐身无人机领域取得重大突破,跻身全... -
警惕!男子持氧气瓶进核磁室 10分钟肿胀毙命
快科技12月15日,据科普中国公众号消息,看似安全的核磁共振检查室,暗藏致命风险。2018年印度,一名健康男子手持氧气瓶踏入核磁共振室,瞬间连人带瓶被吸入仪器,高压氧气灌入口鼻,10分钟后... -
“三全”脑机接口完成首例临床试验:高位截瘫患者能玩游戏了
快科技12月15日消息,中国脑机接口领域诞生了一项里程碑成果!日前,上海脑虎科技宣布,其自主研发的 “三全”脑机接口产品,完成首例临床试验并取得圆满成功。参与临床试验的是一... -
芯片不再“躺平”!美国团队造出首颗单片3D芯片:性能4倍跨越
快科技12月15日消息,近日,一支由斯坦福大学、卡内基梅隆大学、宾夕法尼亚大学和麻省理工学院的工程师组成的研究团队宣布取得重大突破,成功制造出美国首个在商业代工厂生产的单片3D集成电路原... -
SpaceX猎鹰火箭助推器成功回收550次!82%都在船上
快科技12月15日消息,北京时间12月14日13点49分,SpaceX在范登堡太空军基地发射了一枚编号B1093的猎鹰9号火箭,成功将27颗星链V2 Mini卫星送入轨道。已经使用了9次的一级助推器再次顺利完成回...

















