NVIDIA Nemotron 3 Ultra 550BモデルをHugging Faceで公開

2026年06月08日 #Tech

NVIDIAがフラウンティアスケールの大規模言語モデル「Nemotron 3 Ultra」を発表しました。

本モデルは総パラメータ550B（アクティブ55B）を持ち、LatentMoEとMamba-2をハイブリッド化した革新的なアーキテクチャを採用しています。

最大100万トークンという長大なコンテキストに対応し、複雑なエージェントワークフローや高度な推論に最適化されています。

高性能かつオープンウェイトで提供され、多言語対応の商用利用が可能です。

NVIDIAが、最先端のAIエージェント構築を目的とした大規模言語モデル（LLM）「Nemotron-3 Ultra」を発表しました。これはオープンウェイトモデルであり、550Bパラメータという巨大な規模を持ちます。特に複雑な推論や長文分析に特化しており、商用利用も可能な点が注目されています。

ハイブリッド構造と超長文対応能力

Nemotron-3 Ultraは、Mamba-2とMoE（Mixture-of-Experts）を組み合わせた「LatentMoE」という独自のハイブリッドアーキテクチャを採用しています。これにより、従来のLLMの限界を超えた効率性と性能を実現しているとのことです。

さらに、最大100万トークンという超長文コンテキストに対応しており、非常に長い文書やコードベース全体を一度に分析することが可能です。これは複雑な業務プロセスにおける高度な情報処理を可能にする基盤技術と見られています。

本モデルは、単なる対話能力だけでなく、「Agentic（エージェンティック）」と呼ばれる自律的なタスク実行能力に重点を置いて開発されています。複雑なマルチステップのエージェントワークフローや、ツール利用を伴う高精度な推論が得意です。

また、英語に加え、日本語を含む10以上の言語に対応しているため、グローバルなAIソリューションへの応用が期待されます。モデルの動作は、思考プロセス（reasoning trace）を生成してから最終回答を出すという仕組みを採用しており、透明性の高い運用が可能です。

発表された各種ベンチマークの結果を見ると、Nemotron-3 Ultraは複数の分野で非常に高いスコアを獲得しています。特にSWE-Bench（ソフトウェア開発能力）やPinchBenchといったタスク指向型の評価において、競合モデルを上回る結果を出しているとのことです。

これは、単に知識量が多いだけでなく、実際のコーディングや複雑な問題解決といった「実行力」が極めて高いことを示唆しています。高性能GPU環境での運用が必要ですが、その性能はAI開発の新たな標準となる可能性があります。

Nemotron-3 Ultraは、NVIDIAが提供する最先端かつオープンなLLMであり、高度な推論能力と長文処理能力を兼ね備えています。これにより、企業や研究機関における次世代AIエージェント構築の強力な選択肢となる見込みです。

原文の冒頭を表示（英語・3段落のみ）

Model Summary

Total Parameters

550B (55B active)

※ 著作権に配慮し、引用は冒頭3段落までです。続きは元記事をご覧ください。

— 元記事を読む ↗