NVIDIAは、AIの進化をさらに加速させる画期的なオープンモデル「NVIDIA Nemotron™ 3」ファミリーを発表しました。この新しいモデルファミリーは、透明性、効率性、そして特化性に優れたエージェント型AIの開発を支援するために設計されており、AI業界に大きな影響を与えることが期待されています。

Nemotron 3ファミリーとは?AI開発の未来を拓くオープンモデル
Nemotron 3ファミリーは、「Nano」「Super」「Ultra」の3つのサイズで展開されるオープンモデルです。オープンモデルとは、その内部構造や学習データなどが公開されており、誰でも自由に利用したり、改良したりできるAIモデルを指します。これにより、開発者はより透明性の高い環境で、自社のニーズに合わせてAIをカスタマイズし、効率的に開発を進めることができます。
エージェント型AIとは?
Nemotron 3は、特に「エージェント型AIアプリケーション」の構築に特化しています。エージェント型AIとは、特定の目標を達成するために自律的に判断し、行動するAIのことです。例えば、ユーザーの質問に答えるチャットボットだけでなく、複数のAIが連携して複雑なタスクを自動で処理する「マルチエージェントシステム」などが挙げられます。このようなシステムでは、各AIエージェントが協力し合い、より高度な問題解決を目指します。
画期的なアーキテクチャ「ハイブリッド潜在Mixture-of-Experts (MoE)」
Nemotron 3の核となる技術の一つが、その画期的なハイブリッド潜在Mixture-of-Experts (MoE) アーキテクチャです。
MoEとは、複数の専門家(エキスパート)モデルを組み合わせ、タスクに応じて最適な専門家が処理を行うことで、より効率的かつ高性能なAIを実現する技術です。Nemotron 3はこのMoEアーキテクチャを採用することで、以下のような大きなメリットを提供します。
-
高効率: Nemotron 3 Nanoは、Nemotron 2 Nanoと比較してトークン処理のスループットが最大4倍に向上しました。これにより、大規模なマルチエージェントシステムにおいて、毎秒処理できる情報量(トークン)が大幅に増加し、より迅速な応答と処理が可能になります。
-
コスト削減: 推論(AIが予測や判断を行うこと)にかかるコストを最大60%削減できるため、AIアプリケーションの運用コストを大きく抑えることができます。
-
高精度: 高度な強化学習技術と大規模なマルチ環境同時事後トレーニングを組み合わせることで、優れた精度を実現します。
Nemotron 3の3つのサイズとそれぞれの特徴
Nemotron 3ファミリーは、開発者の多様なニーズに応えるために、3つの異なるサイズで提供されます。
1. Nemotron 3 Nano
-
パラメータ数: 300億パラメータの小型モデル(一度に最大30億パラメータをアクティブ化)。
-
特徴と用途: 最も計算コスト効率の高いモデルであり、ソフトウェアのデバッグ、コンテンツの要約、AIアシスタントのワークフロー、低コストの情報検索など、ターゲットを絞った高効率タスクに最適化されています。100万トークンという長いコンテキストウィンドウを持つため、より多くの情報を記憶し、長時間かつ複数ステップのタスクにおける情報の関連付け能力が向上しています。
-
評価: 独立機関Artificial Analysisのベンチマークでは、同規模のオープンモデルの中で最高の精度と効率性を誇ると評価されました。
2. Nemotron 3 Super
-
パラメータ数: 約1,000億パラメータ(トークンあたり最大100億パラメータがアクティブ)。
-
特徴と用途: 高精度なリーズニング(論理的推論)モデルであり、多数のエージェントが連携して複雑なタスクを低レイテンシ(遅延)で実行する必要があるマルチエージェントアプリケーションに優れています。
3. Nemotron 3 Ultra
-
パラメータ数: 約5,000億パラメータ(トークンあたり最大500億パラメータがアクティブ)。
-
特徴と用途: 大規模なリーズニングエンジンとして機能し、綿密な調査と戦略的計画が求められる複雑なAIワークフローに最適です。
Nemotron 3 SuperおよびUltraは、NVIDIA Blackwellアーキテクチャ上でNVIDIAの超高効率な4ビットNVFP4トレーニングフォーマットを採用しています。これにより、メモリ要件を大幅に削減し、トレーニングを高速化することが可能になります。開発者は特定のワークロードに最適なモデルサイズを選択し、数十から数百のエージェントへと拡張しながら、より高速で正確な長期的なリーズニングのメリットを享受できます。
なぜNemotron 3が現在のAI開発において重要なのか?
AI技術が進化するにつれて、企業は単一のチャットボットから、複数のAIが協調して動作する複雑な「マルチエージェントAIシステム」へと移行し始めています。しかし、この移行にはいくつかの大きな課題が伴います。
-
通信オーバーヘッド: 多数のAIエージェントが互いに通信する際に発生するデータ量の増加と処理の遅延。
-
コンテキストドリフト: AIがタスクの途中で本来の目的や文脈を見失ってしまう問題。
-
高い推論コスト: 高度なAIモデルを動かすための計算リソースにかかる費用。
-
透明性の欠如: AIがどのように判断を下したのかが不明瞭であることによる信頼性の問題。
NVIDIA Nemotron 3は、これらの課題に直接対応するために開発されました。オープンなプラットフォームとして、開発者に必要なパフォーマンスと透明性を提供し、信頼性の高いマルチエージェントシステムを大規模に構築・展開できるよう支援します。
また、NVIDIAはNemotronを通じて、各国が自国のデータ、規制、価値観に沿ったAIシステムを構築することを支援する「ソブリンAI」の取り組みを推進しています。
業界をリードする早期採用企業からの期待
Nemotron 3ファミリーは、すでにAccenture、Cadence、CrowdStrike、Cursor、Deloitte、EY、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、Siemens、Synopsys、Zoomといった多様な業界のリーディングカンパニーで導入が検討され、AIワークフローの強化に貢献しています。
ServiceNowの会長兼CEOであるBill McDermott氏は、「NVIDIAとServiceNowの取り組みはこれからさらに加速します。ServiceNowのインテリジェントなワークフロー自動化とNVIDIA Nemotron 3の組み合わせは、比類のない効率性、スピード、そして精度で、今後も業界標準を定義し続けるでしょう」とコメントしています。
PerplexityのCEOであるAravind Srinivas氏は、「当社のエージェントルーターを使用すると、Nemotron 3 Ultraのような、最適にファインチューンされたオープンモデルにワークロードを送信したり、タスクがその独自の機能から恩恵を受ける場合に主要な独自モデルを活用したりすることが可能になり、AIアシスタントが卓越した速度、効率、規模で動作することを保証できます」と述べ、最先端の独自モデルとNemotronのような効率的なオープンモデルを組み合わせることで、AIアシスタントの性能とコスト効率を最適化できる可能性を示唆しています。
スタートアップ企業にとっても、Nemotron 3は大きな機会をもたらします。MayfieldのマネージングパートナーであるNavin Chaddha氏は、「Nemotron 3は、創業者がエージェント型AIアプリケーションやAIチームメイトの構築を迅速に開始できるようにし、NVIDIAの膨大なインストールベースを活用するのに役立ちます」と語り、オープンモデルがイノベーションの加速に貢献することを強調しています。
AIエージェントをカスタマイズするための新しいオープンツールとデータ
NVIDIAは、Nemotron 3モデルだけでなく、特化型AIエージェントを構築するための豊富なトレーニングデータセットと最先端の強化学習ライブラリも公開しています。これにより、開発者はAIモデルをより深く理解し、自社の目的に合わせて最適化することが可能になります。
豊富なトレーニングデータセット
Nemotronのトレーニングデータセットは、総計3兆トークンに及び、以下の種類があります。
これらのデータセットは、高度なリーズニング(推論)、コーディング、複数ステップのワークフロー例を豊富に含んでおり、ドメイン特化型エージェントの作成に必要な基盤を提供します。さらに、Nemotron Agentic Safety Datasetは、実世界のテレメトリ(遠隔測定データ)を提供し、複雑なエージェントシステムの安全性を評価・強化するのに役立ちます。
オープンソースライブラリとサポートツール
開発を加速させるため、NVIDIAは以下のオープンソースライブラリをリリースしました。
-
NeMo Gym: Nemotronモデルのトレーニング環境と事後トレーニングの基盤を提供。
-
NeMo RL: 強化学習のためのライブラリ。
-
NeMo Evaluator: モデルの安全性とパフォーマンスを検証するためのツール。
これらのツールとデータセットは、GitHubとHugging Faceで公開されています。また、Nemotron 3はLM Studio、llama.cpp、SGLang、vLLMといった主要なAI開発ツールでサポートされています。Prime IntellectとUnslothは、NeMo Gymのトレーニング環境をワークフローに直接統合し、強化学習トレーニングをより迅速かつ容易に利用できるようにしています。
Nemotron 3 Nanoの提供開始と今後の展望
Nemotron 3 Nanoは、本日よりHugging Faceおよび以下の推論サービスプロバイダーを通じて利用可能です。
さらに、Couchbase、DataRobot、H2O.ai、JFrog、Lambda、UiPathなどのエンタープライズAIおよびデータインフラプラットフォームでも提供されます。パブリッククラウドを利用する顧客向けには、Amazon Bedrock (サーバーレス) 経由でAWS上での利用が可能であり、Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale、Yottaでも近日中にサポートされる予定です。
Nemotron 3 Nanoは、NVIDIA NIM™ マイクロサービスとしても提供され、NVIDIAアクセラレーテッドインフラ上のあらゆる場所に、プライバシーと制御を最大化しながら、安全かつスケーラブルに展開できます。より大規模なNemotron 3 SuperおよびUltraは、2026年上半期に提供開始が予定されています。
まとめ:Nemotron 3がAIの未来をどう変えるか
NVIDIA Nemotron 3ファミリーの登場は、AI開発、特にエージェント型AIの分野において大きな転換点となるでしょう。オープンモデルとしての透明性と柔軟性、そしてMoEアーキテクチャによる比類ない効率性と精度は、開発者がこれまで直面してきた多くの課題を解決し、より高度で実用的なAIアプリケーションの実現を加速させます。
AI初心者の方も、Nemotron 3のようなオープンモデルの登場により、AI開発の敷居が下がり、多様なアイデアが形になりやすくなることを期待できます。今後、Nemotron 3がどのようにビジネスや社会に貢献し、新たなイノベーションを生み出すのか、その動向に注目が集まります。

