
2026年1月5日、NVIDIAは世界最大の家電・テクノロジー見本市であるCESにおいて、ロボティクス分野に大きな変革をもたらす発表を行いました。それは、フィジカルAIと呼ばれる分野の新しいオープンモデル群、開発フレームワーク、そしてAIインフラのリリースです。これにより、モバイルマニピュレーターからヒューマノイドロボットまで、さまざまな次世代ロボットがNVIDIAの技術を基盤として開発され、世界中の主要企業から発表されています。この革新は、ロボットが現実世界を理解し、推論し、行動を計画する能力を飛躍的に向上させ、多様な産業に汎用的なロボットを導入する道を切り開きます。
フィジカルAIとは?:ロボットが「現実世界を理解する」新たなAIの形
AI(人工知能)と聞くと、チャットボットのように言葉を理解したり、画像を認識したりするAIを思い浮かべる方が多いかもしれません。しかし、「フィジカルAI」は、これら一歩進んで、現実世界そのものを理解し、そこでの物理的な動きや状況を考慮して推論し、行動を計画するAIのことを指します。
簡単に言えば、フィジカルAIはロボットに「常識」や「身体感覚」を与えるようなものです。例えば、人間が目の前のコップを取るとき、その重さや素材、周りの状況を無意識に判断して、どのように手を伸ばし、どのくらいの力で掴むかを決めます。フィジカルAIは、このような現実世界での複雑な判断をロボットが行えるようにするための技術です。
これまでのロボットは、特定のタスクをこなすために事前にプログラムされた動きしかできませんでした。しかし、フィジカルAIによって、ロボットは予期せぬ状況にも対応できるようになり、より柔軟で自律的な行動が可能になります。NVIDIAの創業者兼CEOであるジェンスン フアン氏は、「ロボティクスにとってのChatGPTの瞬間が到来しました」と述べ、フィジカルAIが全く新しい応用分野を切り開くと強調しています。
NVIDIAが提供する革新的なオープンモデル群:ロボットの学習と推論を加速
現在のロボット開発では、高コストで特定のタスクに特化しており、プログラミングも難しいという課題がありました。これを解決し、より汎用的な「スペシャリストジェネラリスト」型ロボットを実現するには、AIの「基盤モデル」を構築する必要がありますが、これには莫大な費用と専門知識が求められます。
NVIDIAは、この課題を克服するために、開発者が大規模な事前学習を行う手間を省き、次世代AIロボットや自律マシンの開発に集中できるようなオープンモデル群を構築しました。これらのモデルは、大手AIプラットフォームであるHugging Faceでも提供されており、オープンソースコミュニティ全体での開発を加速させます。
NVIDIA Cosmos™ Transfer 2.5とNVIDIA Cosmos Predict 2.5
これらのモデルは、フィジカルAI向けのシミュレーション環境において、物理法則に基づいた合成データの生成と、ロボットの行動方針(ポリシー)の評価を可能にするオープンで完全にカスタマイズ可能な世界モデルです。
-
合成データ生成: ロボットを現実世界で動かす前に、コンピューター上の仮想空間(シミュレーション)で、現実とそっくりな環境を作り出し、そこで大量のデータを生成します。これにより、実際のロボットで実験するよりもはるかに効率的かつ安全に学習を進められます。
-
ロボットポリシー評価: シミュレーション内でロボットがどのように動くべきか、どのような行動をとるべきかという「ポリシー」を試行錯誤し、その効果を評価します。これにより、ロボットがより賢く、効率的にタスクをこなせるようになります。
NVIDIA Cosmos Reason 2
これは、オープンなリーズニング視覚言語モデル(VLM)です。VLMは、ロボットが物理世界を人間のように見て、理解し、行動することを可能にします。具体的には、画像や動画といった視覚情報と、テキストなどの言語情報を組み合わせて処理する能力を持っています。
-
視覚情報の理解: ロボットがカメラで捉えた映像から、物体が何であるか、どのような状態にあるか、どこにあるかなどを正確に認識します。
-
言語による推論と行動計画: 認識した視覚情報と言語情報を結びつけ、「この物体をあそこに移動させるにはどうすればいいか」といった推論を行い、具体的な行動計画を立てます。これにより、人間が言葉で指示するだけで、ロボットが複雑なタスクをこなせるようになります。
NVIDIA Isaac™ GR00T N1.6
Isaac GR00Tは、ヒューマノイドロボット(人型ロボット)向けに特別に構築された、オープンなリーズニング視覚言語行動(VLA)モデルです。NVIDIA Cosmos Reasonの推論能力を活用し、より優れた推論と文脈理解を実現しながら、ロボットの全身制御を可能にします。
-
全身制御: 人型ロボットが手足や胴体など、全身を使って協調的な動きを行うことを可能にします。これにより、人間のような器用さやバランス感覚が求められるタスクを実行できます。
-
文脈理解: 単に物体を認識するだけでなく、その場全体の状況や意図を理解し、より適切で自然な行動を選択できるようになります。例えば、同じ「コップを取る」という指示でも、テーブルの上のコップと、倒れそうなコップでは、ロボットの取るべき行動が変わってきます。
Franka Robotics、NEURA Robotics、Humanoidといった企業は、GR00T対応のワークフローを活用し、ロボットの新しい動作のシミュレーション、トレーニング、検証を進めています。
また、Salesforceでは、Agentforce、Cosmos Reason、NVIDIAの動画検索および要約用Blueprintを組み合わせることで、自社ロボットが撮影した映像データを分析し、インシデント解決時間をこれまでの半分に短縮することに成功しています。さらに、LEM SurgicalはNVIDIA Isaac for HealthcareとCosmos Transferを活用し、NVIDIA Jetson AGX Thor™とHoloscanを搭載したDynamis手術ロボットの自律アームをトレーニングしています。XRLabsも、外科用スコープにThorとIsaac for Healthcareを利用し、外科医にリアルタイムAI分析によるガイダンス機能を提供しています。
世界の主要企業がNVIDIA技術で実現する次世代ロボット事例
NVIDIAのフィジカルAI技術は、すでに多くのグローバルリーダー企業によって、さまざまな種類の次世代ロボットに活用されています。これにより、これまで想像でしかなかったようなロボットが現実のものとなりつつあります。
-
Boston Dynamics: 有名な人型ロボット「Atlas」や四足歩行ロボット「Spot」で知られるBoston Dynamicsも、NVIDIA Jetson Thorを既存のヒューマノイドロボットに統合し、ナビゲーションと操作能力を強化しています。
-
Caterpillar: 建設機械の世界的リーダーであるCaterpillarは、NVIDIAとの協業を拡大し、建設および鉱業分野の設備や作業現場に高度なAIと自律性をもたらそうとしています。
-
Franka Robotics: 精密な産業用ロボットアームを開発するFranka Roboticsは、NVIDIAのGR00T対応ワークフローを活用し、ロボットの新しい動作のシミュレーション、トレーニング、検証を行っています。
-
Humanoid: 人型ロボット開発に特化したHumanoidは、NVIDIAの技術を基盤に、高度な人型ロボットを開発しています。Jetson Thorを既存のヒューマノイドロボットに統合し、ナビゲーションと操作能力を強化しています。
-
LG Electronics: 家電大手LG Electronicsは、CES 2026で屋内で幅広い家事をこなせるように設計された新しい家庭用ロボットを発表しました。このロボットは、NVIDIAの技術によって高度な自律性を実現しています。
-
NEURA Robotics: ドイツのNEURA Roboticsは、高性能な協働ロボットを開発しており、Porscheデザインの第3世代ヒューマノイドロボットに加え、精密な操作に最適化された小型ヒューマノイドロボットを投入します。これらもNVIDIAのGR00T対応ワークフローを活用しています。
-
Richtech Robotics: 複雑な作業環境での高度な操作と移動を実現する移動型ヒューマノイド「Dex」を発表しました。
-
AGIBOT: 産業用および民生用のヒューマノイドと、NVIDIA Isaac Simと統合されたロボットシミュレーションプラットフォーム「Genie Sim 3.0」を導入しています。
-
RLWRLD: 既存のヒューマノイドロボットにJetson Thorを統合し、ナビゲーションと操作能力を強化しています。
これらの事例は、NVIDIAのフィジカルAI技術が、産業用から家庭用まで、あらゆる分野のロボット開発に深く貢献していることを示しています。ロボットは、単なる自動機械ではなく、より賢く、より人間らしいパートナーへと進化していると言えるでしょう。
ロボット開発の障壁を打ち破る:オープンソースシミュレーションとコンピューティングフレームワーク
ロボットのトレーニングや評価には、大規模なシミュレーションが不可欠です。しかし、これまでの開発ワークフローは複雑で、異なるコンピューティングリソース間での連携も困難でした。NVIDIAは、これらの課題を解決し、研究段階から実際の製品開発への移行を加速させるための新たなオープンソースフレームワークを公開しました。
NVIDIA Isaac Lab-Arena
Isaac Lab-Arenaは、GitHubで公開されているオープンソースフレームワークで、シミュレーション環境における大規模なロボットポリシー評価とベンチマークのための協調システムを提供します。これにより、ロボットのスキルが物理的なハードウェアに展開される前に、その堅牢性と信頼性を標準化された方法でテストできます。
-
大規模な評価: 多数のロボットやシナリオを同時にシミュレーションし、その行動ポリシーを効率的に評価できます。
-
ベンチマーク: LiberoやRobocasaといった業界標準のベンチマークと接続することで、ロボットの性能を客観的に比較・評価できます。
-
開発の標準化: テストプロセスを標準化することで、異なる開発者やチーム間での連携が容易になり、開発効率が向上します。
NVIDIA OSMO
NVIDIA OSMOは、クラウドネイティブなオーケストレーションフレームワークであり、ロボット開発の全プロセスを単一の使いやすいコマンドセンターに統合します。これにより、開発者はワークステーションから複数のクラウドインスタンスに至るまで、異なるコンピューティング環境全体で、合成データ生成、モデルトレーニング、ソフトウェアインザループテストといったワークフローを定義し、実行できるようになります。
-
ワークフローの統合: 開発の各段階(データ生成、学習、テストなど)をシームレスに連携させ、一元的に管理できます。
-
開発サイクルの加速: 複雑なプロセスを自動化し、効率を向上させることで、ロボットの開発期間を短縮します。
-
クラウドネイティブ: クラウドの柔軟性とスケーラビリティを活用し、必要に応じてコンピューティングリソースを増減させることができます。
OSMOはすでに利用可能となっており、Hexagon Roboticsのようなロボット開発者によって活用され、Microsoft Azure Robotics Acceleratorツールチェーンにも統合されています。
Hugging Faceとの協業で広がるオープンソースロボティクス開発の可能性
ロボティクスは現在、AI開発プラットフォームであるHugging Faceにおいて最も急速に成長している分野の一つであり、NVIDIAのオープンモデルとデータセットがトップのダウンロード数を占めています。NVIDIAは、この活発なオープンソースコミュニティをさらに強化するため、Hugging Faceと協力し、NVIDIAのオープンソース技術を主要なロボティクスフレームワークであるLeRobotに統合しています。
この連携により、NVIDIAのIsaacおよびGR00TテクノロジがLeRobotライブラリで利用できるようになり、ファインチューニングや評価が容易になります。これにより、NVIDIAを活用する200万人のロボット開発者とHugging Faceの1,300万人のAI開発者からなるグローバルコミュニティが結びつき、エンドツーエンドの開発が加速します。
具体的な例として、Hugging Faceのオープンソースヒューマノイドロボット「Reachy 2」は、NVIDIA Jetson Thor™ロボティクスコンピューターと完全に相互運用可能になり、開発者はGR00T N1.6を含むあらゆるVLA(視覚言語行動)モデルを実行できます。また、Hugging Faceのオープンソース卓上ロボット「Reachy Mini」は、NVIDIA DGX Spark™と完全に相互運用可能となり、NVIDIAの大規模言語モデルやローカルで動作する音声およびコンピュータービジョン向けオープンモデルを活用したカスタム体験を構築できます。
産業の未来を担うNVIDIA Jetson ThorとT4000モジュール:エッジAIの最前線
ロボットが現実世界で自律的に動作するためには、高度なAI処理能力が不可欠です。特に、人型ロボットのような複雑なリーズニング機能を備えたロボットは、膨大な演算要件を満たす必要があります。NVIDIAは、この課題に応えるために、高性能なエッジAIコンピューターを提供しています。
NVIDIA Jetson Thor™ロボティクスコンピューター
NVIDIA Jetson Thorは、リーズニング機能を備えたヒューマノイドロボットの演算要件を満たすために設計された高性能なロボティクスコンピューターです。CESでは、多くのヒューマノイド開発者がJetson Thorを統合した最先端のロボットを披露しました。
-
NEURA Robotics: Porscheデザインの第3世代ヒューマノイドと小型ヒューマノイドにJetson Thorを採用しています。
-
Richtech Robotics: 移動型ヒューマノイドDexにJetson Thorを搭載し、複雑な作業環境での高度な操作と移動を実現しています。
-
AGIBOT: 産業用および民生用ヒューマノイドにJetson Thorを活用しています。
-
LG Electronics: 新しい家庭用ロボットにJetson Thorを搭載し、屋内での幅広い家事をこなせるように設計されています。
-
Boston Dynamics, Humanoid, RLWRLD: 既存のヒューマノイドロボットにJetson Thorを統合し、ナビゲーションと操作能力を強化しています。
NVIDIA Jetson™ T4000モジュール
NVIDIA Jetson T4000モジュールは、NVIDIA Jetson Orin™ユーザーにコスト効率に優れた高性能アップグレードパスを提供します。このモジュールは、NVIDIA Blackwellアーキテクチャを自律型マシンおよび汎用ロボティクスにもたらし、1,000個購入時の単価は1,999ドルです。
-
高性能とエネルギー効率: 1,200 FP4 TFLOPSと64GBメモリを備え、前世代の4倍の性能を発揮します。また、省電力が求められる自律システムに最適な70W以内に構成可能です。
-
幅広い応用: 産業用ロボット、自律移動ロボット、スマートシティのインフラなど、さまざまなエッジAIアプリケーションに適しています。
NVIDIA IGX Thor
2026年1月後半に提供開始予定のNVIDIA IGX Thorは、産業用エッジ領域にロボティクスを拡張し、エンタープライズソフトウェアのサポートと機能安全に対応した高性能AIコンピューティングを提供します。ArcherはIGX Thorを使用してAIを航空分野に導入し、航空機の安全性、空域統合、自律動作対応システムにおける重要な機能を前進させています。
AAEON、Advantech、ADLINK、Aetina、AVerMedia、Connect Tech、EverFocus、ForeCR、Lanner、RealTimes、Syslogic、Vecow、YUANなどのパートナー企業は、エッジAI、ロボティクス、組み込みアプリケーション向けにThor搭載システムを提供しています。
まとめ:フィジカルAIが切り拓くロボティクスの新時代
NVIDIAがCES 2026で発表した新しいフィジカルAIモデル群、開発フレームワーク、そして高性能なエッジAIコンピューティングは、ロボティクス分野に革命をもたらす可能性を秘めています。これらの技術は、ロボットが現実世界をより深く理解し、自律的に推論し、柔軟に行動計画を立てることを可能にします。
オープンモデルの提供は、ロボット開発にかかるコストと専門知識の障壁を低減し、より多くの開発者が次世代AIロボットの創造に参加できる環境を整えます。また、Isaac Lab-ArenaやOSMOといった開発フレームワークは、複雑な開発ワークフローを簡素化し、研究から実用化への道のりを加速させます。
Boston DynamicsやCaterpillar、LG Electronicsといった世界的企業がNVIDIAの技術を基盤に次々と新しいロボットを発表していることからも、この技術が産業界に与える影響の大きさがうかがえます。今後、工場や倉庫、医療現場、さらには私たちの家庭においても、より賢く、頼りになるロボットが活躍する未来が、きっと訪れることでしょう。NVIDIAの技術革新は、まさに「ロボティクスにとってのChatGPTの瞬間」であり、フィジカルAIが現実世界を理解し、人間と協働する新たな時代の幕開けを告げています。今後の進展に目が離せません。

