ヴァレオとNATIXが提携！フィジカルAIの未来を拓くオープンソース・マルチカメラ世界基盤モデル
ヴァレオとNATIXの提携とは？
「世界基盤モデル（WFM）」とは何か？AI初心者向けに徹底解説
オープンソース・マルチカメラ世界基盤モデルの具体的なアプローチ
フィジカルAIの未来と社会への影響
まとめ

ヴァレオとNATIXが提携！フィジカルAIの未来を拓くオープンソース・マルチカメラ世界基盤モデル

近年、AI（人工知能）の進化は目覚ましく、私たちの生活や産業に大きな影響を与えています。特に、自動運転車やロボットといった「物理世界で動き、判断するAI」であるフィジカルAIの分野では、さらなる技術革新が求められています。そんな中、自動車技術の世界的リーダーであるヴァレオと、カメラを活用した分散型物理インフラネットワーク（DePIN）のグローバル企業であるNATIX Networkが、非常に重要な提携を発表しました。

両社は、世界でも最大級となる「オープンソース・マルチカメラ世界基盤モデル（WFM）」の構築を目指します。この取り組みは、フィジカルAIの開発を大きく加速させると期待されています。AI初心者の方にも分かりやすいように、この提携がなぜ重要なのか、そして未来にどのような影響を与えるのかを詳しく見ていきましょう。

ヴァレオとNATIXの提携とは？

2026年1月22日、フランスのパリとドイツのハンブルグで、ヴァレオとNATIX Networkが提携を発表しました。この提携の目的は、自動運転やロボティクス分野におけるAIの進化を加速させるための基盤となる、オープンソースのマルチカメラ世界基盤モデルを構築することです。

ヴァレオは、1923年に設立されたフランスの自動車部品サプライヤーで、特に運転支援システムや自動運転の分野でAI研究をリードしてきました。同社のAIリサーチセンターは、モビリティ・インテリジェンスを安全かつ責任ある形で発展させることを目標に掲げています。

一方、NATIX Networkは2020年にハンブルクで設立された比較的新しい企業ですが、カメラを活用した分散型物理インフラネットワーク（DePIN）の分野で急速に成長しています。同社の「VX360」はテスラ車のカメラを利用して360°マルチカメラ映像を収集し、また、スマートフォンアプリ「Drive&」を通じてリアルタイムの地理空間データをクラウドソースで収集するなど、大規模なリアルワールドデータネットワークを構築しています。Messari社のレポート「State of DePIN 2024」では、世界最大の分散型マルチカメラ・データネットワークを運営していると評価されています。

この提携では、ヴァレオが持つ世界的なモデリングに関する専門知識と、NATIXが持つ広範なマルチカメラ・データセットが組み合わされます。これにより、現実世界の動きや相互作用を深く学習し、未来を予測し、推論できるオープンソースの世界モデルの実現を目指します。

「世界基盤モデル（WFM）」とは何か？AI初心者向けに徹底解説

「世界基盤モデル（WFM）」という言葉は、AI初心者の方には聞き慣れないかもしれません。しかし、これはAIの未来を形作る上で非常に重要な概念です。理解を深めるために、まず最近よく耳にする「大規模言語モデル（LLM）」と比較しながら見ていきましょう。

大規模言語モデル（LLM）との違い

大規模言語モデル（LLM）は、ChatGPTに代表されるように、テキストデータを大量に学習し、人間のように自然な文章を生成したり、質問に答えたりするAIモデルです。LLMは「言葉の世界」を理解し、その中で推論や生成を行います。

それに対して、世界基盤モデル（WFM）は、「物理世界」を理解し、その中で学習、予測、推論を行うAIモデルです。WFMは、テキストだけでなく、画像や動画、センサーデータなど、現実世界から得られるあらゆる種類のデータを扱います。これにより、AIが「今、目の前で何が起きているか」だけでなく、「次に何が起きるか」を予測し、適切な行動をとれるようになることを目指します。

WFMの役割：物理世界の理解、学習、予測、推論

自動運転車やロボットが安全かつ自律的に機能するためには、周囲の環境を正確に理解し、未来の状況を予測する能力が不可欠です。例えば、自動運転車が交差点に差し掛かったとき、単に他の車や歩行者を「認識」するだけでなく、それらの車や歩行者が「次にどこへ動くか」を予測できなければ、安全な運転はできません。

世界基盤モデルは、この「物理世界での予測能力」をAIに与えることを目的としています。具体的には、AIが以下のことをできるようになります。

物理世界の理解: センサーデータ（カメラ映像、レーダーなど）から、空間的な情報（物の位置や形）と時間的な情報（物の動きや変化）を組み合わせて、4次元環境（空間と時間）を正確に把握します。
学習: 膨大な現実世界のデータから、物理法則や様々な事象の因果関係を学習します。
予測: 学習した知識に基づいて、未来の状況を予測します。例えば、ある車が特定の速度と方向で動いている場合、数秒後にどこにいるかを予測します。
推論: 予測に基づいて、最適な行動を推論します。例えば、衝突を避けるために減速すべきか、車線変更すべきかを判断します。

既存の認識モデルとの違い

従来のAIモデルの多くは、「認識」に特化していました。例えば、画像認識AIは写真に何が写っているかを識別するのに優れていますが、その物体が次にどうなるかまでは予測できませんでした。WFMは、この認識能力をさらに一歩進め、「今何が起きているか」だけでなく、「次に何が起きるか」を予測する能力を持つ点で大きく異なります。

これは、AIが単なる情報処理装置から、より人間のように「未来を想像し、計画を立てる」能力を持つ存在へと進化することを意味します。この能力は、自動運転、ロボティクス、スマートシティなど、物理世界と密接に関わるあらゆるAIアプリケーションにとって、まさに革命的な進歩となるでしょう。

オープンソース・マルチカメラ世界基盤モデルの具体的なアプローチ

ヴァレオとNATIXの提携は、この世界基盤モデルの構築に向けて、非常に具体的なアプローチを採用しています。その鍵となるのが、両社の技術的強みの融合と「オープンソース」という開発形態です。

ヴァレオの専門知識：生成世界モデリングの研究実績

ヴァレオは、長年にわたり自動車業界のAI研究の最前線に立ってきました。特に、生成AIの技術を物理世界に応用する「生成世界モデリング」において、確かな実績を持っています。同社は、主にフロントカメラの映像と大規模なオンラインデータセットで学習させた2つのオープンソース・フレームワークを開発しています。

VaViM（Video Autoregressive Model）: これは、動画データから未来の映像を予測するモデルです。自動運転車が次に何を見るかを予測する能力につながります。
VaVAM（Video-Action Model）: これは、動画データと行動（アクション）の関係を学習するモデルです。特定の行動が環境にどのような影響を与えるかを理解するのに役立ちます。

これらのフレームワークは、AIが現実世界の複雑な動きを学習し、未来を生成的に予測するための強力な基盤となります。

NATIXの強み：分散型360°リアルワールド・データネットワーク

ヴァレオの高度なモデリング技術をさらに強力にするのが、NATIXが持つ膨大なリアルワールドデータです。NATIXは、過去7ヶ月間で10万時間以上ものマルチカメラ走行データ（60万時間以上のビデオデータ）を収集しており、これは自動車業界でも非常に大規模なものです。

NATIXの分散型マルチカメラ・ネットワークは、米国、欧州、アジア全域の実際の車両から継続的にデータを取得しています。これにより、多様な地域や走行条件における、現実世界の膨大な情報がAIの学習に利用できます。特に、マルチカメラからの360°データは、AIがより包括的な空間認識能力を獲得するために不可欠です。

両社の技術の融合によるメリット

ヴァレオの生成世界モデリング技術とNATIXの広範なマルチカメラデータネットワークが融合することで、AIは以下のような大きなメリットを得られます。

真のエッジケースからの学習: 実際の車両から収集された多様なデータには、通常のシミュレーションでは再現が難しい「エッジケース」（稀な状況や予期せぬ出来事）が豊富に含まれています。AIがこれらのエッジケースから学習することで、自律型システムの安全性と信頼性が大幅に向上します。
完全な空間認識能力の獲得: これまでの多くのAIモデルは、前方視界に限定されたデータで学習していましたが、マルチカメラ入力へと拡張することで、AIは自動運転車やロボットが実際に使用するのと同等の、周囲360度を把握する完全な空間認識能力を獲得できます。

オープンソース化の意義

この世界基盤モデルが「オープンソース」として開発されることも、非常に重要な点です。オープンソースとは、モデルやデータセット、トレーニングツールなどが一般に公開され、誰もが自由に利用、改良、配布できることを意味します。

オープンソース化により、世界中の研究者や開発者がこの強力な基盤モデルを利用して、独自のフィジカルAIアプリケーションを開発したり、モデルの微調整やベンチマーク測定を行ったりできるようになります。これにより、AIコミュニティ全体のイノベーションが促進され、フィジカルAIの品質とアクセシビリティが飛躍的に向上することが期待されます。

フィジカルAIの未来と社会への影響

ヴァレオとNATIXが構築するオープンソース・マルチカメラ世界基盤モデルは、フィジカルAIの分野に多大な影響を与え、私たちの社会に大きな変革をもたらす可能性を秘めています。

自動運転やロボットの安全な導入加速

世界基盤モデルによって、AIは物理世界をより深く理解し、未来を予測できるようになります。これは、自動運転車がより安全に、より効率的に公道を走行できるようになることを意味します。例えば、予期せぬ歩行者の飛び出しや、他の車両の急な動きにも、AIが事前に予測して対応できるようになるでしょう。

また、工場や物流倉庫で働くロボットも、周囲の環境や人間の動きをより正確に予測し、安全かつ柔軟に作業を進められるようになります。これにより、自動運転技術やロボット技術の社会実装が、これまで以上に加速すると考えられます。

エッジケースからの学習能力向上

現実世界には、教科書通りではない、予測困難な「エッジケース」が数多く存在します。例えば、異常気象時の走行条件や、予測不能な人間の行動などです。これまでのAIは、このようなエッジケースへの対応が課題でした。

しかし、NATIXが提供する膨大なリアルワールド・マルチカメラデータと、ヴァレオの生成世界モデリング技術によって構築されるWFMは、AIがこれらのエッジケースから直接学習することを可能にします。これにより、AIはより堅牢で、予期せぬ事態にも対応できる、信頼性の高いシステムへと進化するでしょう。

AIの「次なる波」としてのフィジカルAI

NATIXのCEO兼共同創設者であるAlireza Ghods氏は、世界基盤モデル（WFM）を「2017年から2020年にかけての大規模言語モデル（LLM）の台頭に匹敵する、一世代に一度のチャンス」と述べています。そして、「最初にスケーラブルな世界モデルを構築したチームが、AIの次なる波である『フィジカルAI』の基盤を定義することになるでしょう」と語っています。

これは、AIがテキストや画像といったデジタル世界だけでなく、物理世界において人間の知能に近いレベルで機能する時代が到来することを示唆しています。フィジカルAIは、製造業、物流、医療、農業、そして私たちの日常生活のあらゆる側面に革新をもたらし、新たな産業やサービスを生み出す可能性を秘めています。

ヴァレオとNATIXの提携は、まさにこの「フィジカルAI」の時代を切り拓くための重要な一歩と言えるでしょう。

まとめ

ヴァレオとNATIX Networkの提携は、オープンソース・マルチカメラ世界基盤モデルの構築を通じて、フィジカルAIの発展に新たな可能性をもたらします。ヴァレオの生成世界モデリングの専門知識とNATIXの広範なリアルワールドデータが融合することで、AIは物理世界をより深く理解し、未来を予測する能力を獲得します。

この取り組みは、自動運転車やロボットの安全な導入を加速させ、AIが真のエッジケースから学習することを可能にします。オープンソースという形態で開発されることで、世界中の開発者がこの強力な基盤モデルを利用し、フィジカルAIのイノベーションをさらに推進できるでしょう。

世界基盤モデルは、大規模言語モデルに続く「AIの次なる波」として、私たちの社会に大きな変革をもたらすことが期待されています。ヴァレオとNATIXのこの画期的な提携が、どのような未来を創造していくのか、今後の動向に注目が集まります。

ヴァレオに関する詳しい情報はこちらをご覧ください。
http://www.valeo.co.jp

NATIXに関する詳しい情報はこちらをご覧ください。
NATIX.network