人とロボットが手を取り合う未来へ:富士通の「空間World Model技術」
近年、AI(人工知能)の進化は目覚ましく、私たちの生活や社会に大きな変化をもたらしています。特に、ロボットとAIが連携し、人間と協力し合う「共存・協働」の未来が期待されています。そんな中、富士通株式会社は、現実世界の物理法則を理解したAIである「Physical AI」の研究をさらに発展させるべく、画期的な「空間World Model技術」を開発しました。
この技術は、空間内にいる人、ロボット、そして様々な物体の未来の状態を予測する能力を持ち、これまで実現が難しかった人とロボットのシームレスな協調動作や、複数のロボットが最適に連携する動きを可能にします。AI初心者の方にも分かりやすく、この革新的な技術がどのようなもので、私たちの未来にどのような影響を与えるのかを詳しく見ていきましょう。
第1章: AIはどこまで進化した?Physical AIが描く現実世界の未来
AIはこれまで、主にインターネットやコンピュータの中といった「デジタル空間」で発展してきました。例えば、検索エンジンの精度向上や、おすすめ商品の表示、画像認識などがその代表例です。しかし、最近ではAIの活躍の場が「現実世界」へと広がり始めています。これが「Physical AI」と呼ばれる分野です。
Physical AIとは?現実世界を理解するAI
Physical AIは、その名の通り「物理的な世界」を理解し、自律的に行動するAIのことです。これは、単にプログラムされた動きをするだけでなく、現実世界の「物理法則」を学習し、それに基づいて状況を判断し、行動します。例えば、重力や摩擦、衝突といった物理的な現象を考慮に入れて、より自然で安全な動きができるようになります。
このPhysical AIは、自動運転車やスマートファクトリー(AIを活用した賢い工場)など、様々な分野で大きな期待が寄せられています。特に、世界中で深刻化している労働力不足の解消や、産業全体の生産性向上において、Physical AIは重要な鍵となると考えられています。
第2章: なぜ人とロボットの共存は難しいのか?現在のAIの課題
Physical AIの可能性は大きいものの、現在の技術にはまだ課題があります。
整備された環境と予測困難な現実
現在のPhysical AIは、主に製造現場や物流倉庫のような、通路が厳密に定められ、物の配置も比較的安定している「整備された環境」での活用が中心です。このような場所では、ロボットの動きを事前に計画しやすく、予期せぬ事態も少ないため、AIが比較的容易に機能します。
しかし、私たちが生活する住宅やオフィスといった「一般的な環境」では、状況が大きく異なります。人は予測困難な動きをし、物の配置も頻繁に変わります。このような動的に変化する空間の状況をリアルタイムで正確に把握することは、現在のAIにとって非常に難しい課題でした。
協調動作の壁
さらに、多数の人やロボットが同じ空間に共存する環境では、お互いが次にどう動くのかを予測できなければ、スムーズな「協調動作」を実現することは困難です。例えば、ロボットが人の動きを予測できなければ、衝突を避けるための適切な行動を取ることができません。また、複数のロボットが連携して一つの作業を行う場合でも、お互いの動きを予測できなければ、最適なタイミングで役割を分担することができないのです。
第3章: 富士通が長年培ってきた技術力と新たな挑戦
このような課題を解決するため、富士通は長年にわたり培ってきたAIとコンピュータビジョン技術を駆使してきました。
空間を把握するコンピュータビジョン技術
富士通はこれまで、商業施設での人の流れを分析する「人流解析」や、防犯分野での「異常行動検出」など、カメラの映像から空間の状況を詳細に把握する「コンピュータビジョン技術」を発展させてきました。これらの技術は、複雑な映像データの中から意味のある情報を抽出し、状況を理解する能力を高めるものです。
また、デジタル領域では、人と協調しながら自律的に業務を進めるAI技術「Fujitsu Kozuchi AI Agent」などを開発し、AIの可能性を広げてきました。
空間ロボティクス研究センターの設立
これらのAI・コンピュータビジョン技術をPhysical AIの研究に応用し、人とロボットが協調する新しい社会の実現を目指すため、富士通は2025年4月に「空間ロボティクス研究センター」を設立しました。この専門研究センターが、複雑な現実空間を把握するコンピュータビジョン技術を基盤とし、今回ご紹介する「空間World Model技術」を開発したのです。
この技術により、整備されていない一般的な環境においても、空間全体の状況をリアルタイムで把握し、人とロボット、そして複数ロボット間の協調動作を実現することが可能になります。
第4章: 「空間World Model技術」の核心に迫る!未来を予測するAIの仕組み
富士通が開発した「空間World Model技術」は、主に2つの大きな特長を持っています。これによって、AIが現実世界をより深く理解し、未来を予測する能力が飛躍的に向上しました。
4.1. 空間を丸ごと理解する「3Dシーングラフ」の力
一般的な環境では、人やロボットが常に移動し、物の配置も変化するため、空間の状況は常に動的に変化します。この変化を正確に捉えることが、これまでの大きな課題でした。
従来、防犯カメラやロボットに搭載されたカメラの映像を統合して空間全体を把握する技術が検討されてきましたが、カメラの種類(固定型と移動型)や設置場所によって「見た目」(映像の歪みや視野)が大きく異なるため、リアルタイムで正確に統合することは非常に困難でした。
そこで富士通は、映像の「画素(ピクセル)単位」で統合するのではなく、「人」や「ロボット」、「物体」といった「オブジェクト単位」でカメラの情報を統合する技術を開発しました。これにより、カメラごとの見た目の差異の影響を受けにくく、空間全体をリアルタイムで正確に把握できるようになりました。この技術によって構築されるのが、空間内のオブジェクトとその関係性を表す「3Dシーングラフ」です。

4.2. 相手の「意図」まで読み解く未来予測
人とロボットがスムーズに協調するためには、単に相手の動きを認識するだけでなく、その動きの「背景にある意図」を推定し、未来の行動を予測することが非常に重要です。
これまでのWorld Model技術は、ロボット自身の周囲の環境しかモデル化できず、空間全体にいる他の人やロボットの状況変化を捉えることができませんでした。そのため、他の存在の動きを予測し、自身の行動を最適化することは困難だったのです。
富士通の「空間World Model技術」では、空間内の人、ロボット、物体の関係性を時系列で記録した「時系列3Dシーングラフ」のデータを活用し、空間全体のWorld Modelを学習する新しい方式を開発しました。これにより、人、ロボット、物体間の多様な相互作用性を深く理解し、複数の行動主体(人やロボット)が次にどのような行動を起こすかを推定できるようになります。その結果、対象の空間における未来の状態を予測することが可能になりました。
この未来予測能力によって、自律ロボット間の衝突を効果的に回避したり、複数のロボットが連携して作業を行う際に、それぞれのロボットに最適な協調動作プランを生成したりすることが可能になります。
この技術は、学術的な公開ベンチマークデータ(注1)において、他者の行動意図推定精度を従来の3倍向上させることが確認されています。これは、AIが人間の意図をより正確に読み取れるようになったことを示しており、人とロボットのコミュニケーションが大きく進歩した証拠と言えるでしょう。
- 注1: JRDB-Socialは、カメラを通じて人の行動や行動目的を推定する学術的なベンチマークです。
第5章: 「空間World Model技術」が描く、私たちの未来
この「空間World Model技術」は、私たちの社会にどのような変化をもたらすのでしょうか。
ロボットがもっと身近になる未来
これまでロボットの導入が難しかった住宅やオフィス、店舗などの一般的な環境でも、ロボットが人々とスムーズに共存し、様々なサポートをしてくれる未来が期待されます。例えば、家事手伝いロボットが家族の動きを予測して邪魔にならないように動いたり、オフィスで働くロボットが人の会話を妨げずに書類を運んだりするようなシーンが考えられます。
産業のさらなる効率化
工場や物流倉庫といった産業現場でも、この技術は大きな効果を発揮します。複数のロボットが互いの動きを予測し、連携しながら作業を進めることで、これまで以上に効率的で安全な生産・物流体制が実現できるでしょう。これは、生産性の向上だけでなく、人手不足の解消にも大きく貢献します。
世界への発信と技術実証
富士通は、この「空間World Model技術」を2026年1月6日から1月9日まで米国ラスベガスで開催される世界最大級のテクノロジー見本市「CES2026」にデモ出展する予定です。これにより、世界に向けてその革新性をアピールします。
さらに、2026年度中には、富士通の研究開発の主要拠点である「Fujitsu Technology Park」などを活用し、実際の環境で技術の有効性を検証する実証実験を進めていく計画です。これにより、技術の実用化がさらに加速することが期待されます。
第6章: 持続可能な社会への貢献
富士通の「空間World Model技術」は、国連が定める「持続可能な開発目標(SDGs)」にも貢献します。
富士通のパーパス(存在意義)である「イノベーションによって社会に信頼をもたらし、世界をより持続可能にしていくこと」は、SDGsへの貢献と深く結びついています。
この技術によって、ロボットがこれまで以上に多くの場所で活躍できるようになれば、人々の働き方を改善し、経済成長を促進することにつながります。これはSDGsの目標8「働きがいも経済成長も」に貢献します。
また、革新的なAI技術によって産業の生産性や効率性が向上することは、SDGsの目標9「産業と技術革新の基盤をつくろう」の達成にも寄与します。このように、富士通の技術開発は、単なる利便性の向上だけでなく、より良い社会の実現を目指すものです。
まとめ: 人とロボットが手を取り合う未来へ
富士通が開発した「空間World Model技術」は、AIが現実世界を深く理解し、未来を予測する能力を飛躍的に向上させるものです。この技術によって、これまで難しかった人とロボットのシームレスな協調動作が実現し、私たちの生活空間や産業現場において、ロボットがより身近で信頼できるパートナーとなる未来が近づいています。
AI初心者の方も、この技術がもたらす変化にぜひ注目してみてください。富士通の取り組みは、人とロボットが手を取り合い、より豊かで持続可能な社会を築くための重要な一歩となるでしょう。
本件に関する詳細な情報やお問い合わせは、以下のリンクからご確認ください。
-
富士通株式会社 お問い合わせフォーム: https://contactline.jp.fujitsu.com/customform/csque04802/873532/
-
富士通株式会社グローバルサイト: https://global.fujitsu/ja-jp/pr

