【NVIDIA GTC 2026】ビーマー社、AIの精度を保つ「ML-Safeビデオデータ圧縮」でフィジカルAIのデータ課題を解決へ!VAST Data社との共同デモも

はじめに:AI時代のデータ課題を解決する新技術

現代社会において、AI(人工知能)の進化は目覚ましく、私たちの生活や産業に大きな変革をもたらしています。特に、現実世界と物理的に相互作用するAI、通称「フィジカルAI」の分野は、自動運転車、ロボット、スマートスペース(賢い空間)など、多岐にわたる応用が期待されています。これらのフィジカルAIは、周囲の状況を正確に認識し、学習するために膨大な量のビデオデータを必要とします。

そんな中、ビデオ最適化技術の世界的リーダーであるビーマー社は、2026年3月16日から19日にかけて米国サンノゼで開催される世界的なAIカンファレンス「NVIDIA GTC 2026」にて、画期的な技術をデモ展示すると発表しました。それが「ML-Safeビデオデータ圧縮」です。この技術は、AIの学習結果に悪影響を与えることなく、ビデオデータのファイルサイズを大幅に削減できるというもので、フィジカルAIが直面するデータ管理の大きな課題を解決する可能性を秘めています。

本記事では、AI初心者の方にも分かりやすく、ビーマー社の「ML-Safeビデオデータ圧縮」技術がなぜ今必要とされているのか、どのような仕組みで機能するのか、そしてNVIDIA GTC 2026で発表されるVAST Data社との共同デモがどのような意味を持つのかを詳しく解説していきます。

フィジカルAIの進化とデータ爆発の現実

自動運転車を想像してみてください。道路の状況、歩行者、他の車両、信号機、標識など、常に周囲の映像を詳細に捉え、瞬時に判断を下す必要があります。ロボットも同様に、作業環境のオブジェクトや動きを正確に把握しなければなりません。スマートスペースでは、人々の動きや機器の状態を映像で監視し、効率的な運用やセキュリティ維持に役立てます。

これらのフィジカルAIシステムは、トレーニング(学習)や検証のために、現実世界で撮影された映像や、シミュレーションによって作られた合成映像を大量に利用します。そのデータ量は、想像をはるかに超える「ペタバイト級」に達し、しかもその増加ペースは加速の一途をたどっています。1ペタバイトは1000テラバイト、つまり100万ギガバイトに相当する膨大な量です。

これほど巨大なビデオデータを扱うチームは、AIモデルの精度を維持しつつ、効率的にデータを管理できる信頼性の高い圧縮技術を求めています。しかし、従来のビデオ圧縮技術には、以下のような大きな課題がありました。

  • ストレージ・ネットワーク効率: データを圧縮すればファイルサイズは小さくなり、保存コストやネットワーク転送にかかる負荷は軽減されます。しかし、圧縮しすぎると画質が劣化し、情報が失われる可能性があります。

  • MLモデル精度: AIモデルは、高品質なデータで学習することで高い精度を発揮します。従来の圧縮では、人間には気づきにくいわずかな画質の劣化でも、AIモデルの認識精度や判断能力に悪影響を与えることがありました。これは、自動運転車のような命に関わる分野では特に深刻な問題です。

  • 運用スループット: データの取り込みからAIモデルでの学習、検証までのプロセス全体を通して、高速かつ一貫したデータ処理が求められます。圧縮・解凍に時間がかかると、AI開発全体のスピードが落ちてしまいます。

このように、従来の技術では「効率性」と「AIの精度」そして「処理速度」の間に大きなトレードオフが存在し、AIシステムの性能向上を妨げる要因となっていました。

「ML-Safeビデオデータ圧縮」とは?AIの精度を守る画期的な技術

ビーマー社が開発した「ML-Safeビデオデータ圧縮」は、前述のトレードオフを解決するために生み出された画期的な技術です。その名の通り、「ML-Safe(機械学習にとって安全)」である点が最大の特徴です。つまり、ビデオデータを圧縮しても、AIモデルの学習や推論(判断)の精度に悪影響を与えないことを意味します。

この技術の核となっているのが、ビーマー社の特許技術である「CABR(Content-Adaptive Bitrate:コンテンツ適応型ビットレート)」です。CABRは、映像の内容(コンテンツ)に応じて、フレームごと、あるいはシーンごとに最適なビットレート(データ量)を自動的に調整します。たとえば、動きの少ない静止画に近いシーンではデータ量を抑え、動きが激しい複雑なシーンでは必要なデータ量を維持するといった賢い判断を行います。

このインテリジェントな調整により、ビーマー社のML-Safe圧縮は、以下の顕著な効果を実現しています。

  • 最大50%のファイルサイズ削減: 過去1年間のベンチマークテストにおいて、最大でファイルサイズを半分に削減できることが確認されています。これにより、ストレージコストの大幅な削減や、データ転送の高速化が可能になります。

  • MLモデル精度の維持: 業界標準のデータセットを用いた評価では、複数の品質指標や精度指標において、AIモデルの精度が維持されることが検証されています。これは、圧縮によってAIが「見落とす」情報がほとんどないことを意味し、フィジカルAIの信頼性を高める上で極めて重要です。

ML-Safeな動画最適化

さらに、この圧縮プロセスにはGPU(Graphics Processing Unit)アクセラレーションが活用されています。GPUは、大量のデータを並行して高速処理する能力に優れており、データの取り込みからAIモデルでの学習・検証に至るまでのエンドツーエンド(最初から最後まで)の処理において、高いスループット(処理能力)と一貫性を確保します。これにより、AI開発のサイクル全体が加速され、より迅速なモデルの改善や展開が可能になります。

VAST Data社との共同デモ:Video RAG/VSS向け「取り込み時ML-Safe圧縮」パイプライン

NVIDIA GTC 2026の会場では、ビーマー社はAIオペレーティングシステム企業であるVAST Data社と共同で、さらに進んだデモンストレーションを披露します。それが「Video RAG/VSSに最適化された取り込み時ML-Safe圧縮パイプライン」の世界初公開です。

Video RAG/VSSとは?

AI初心者の方には少し難しい言葉かもしれませんが、簡単に説明しましょう。

  • RAG (Retrieval Augmented Generation): これは「検索拡張生成」と訳され、AIが何かを生成する際に、事前に大量のデータの中から関連情報を検索し、それを参考にすることで、より正確で信頼性の高い結果を出す技術です。例えば、チャットボットが質問に答える際に、社内文書を検索して回答を生成するようなイメージです。「Video RAG」はこれをビデオデータに応用し、特定のビデオシーンやイベントに関する情報を検索してAIが活用できるようにします。

  • VSS (Vector Similarity Search): これは「ベクトル類似性検索」と訳され、データを数値の「ベクトル」として表現し、ベクトル間の距離(似ている度合い)に基づいて検索する技術です。例えば、ある画像に似た画像を大量の画像データの中から見つけ出す、といった用途に使われます。「Video VSS」は、特定のビデオクリップに似たクリップを、膨大なビデオデータの中から高速に見つけ出すことを可能にします。

自動運転車やスマートスペースでは、特定のイベント(例えば、急ブレーキがかかった瞬間や、不審者が侵入したシーン)を素早く検索し、分析する必要があります。Video RAG/VSSは、このような高度なビデオデータ活用を可能にするための基盤技術です。

「取り込み時ML-Safe圧縮」パイプラインの革新性

今回の共同デモでは、VAST Data社のAI OS上で、ビデオデータがシステムに取り込まれる段階(取り込み時)で、GPUアクセラレーションを活用したML-Safe圧縮を適用する新しいデータパイプラインが紹介されます。このパイプラインの主な特徴は以下の通りです。

  1. 高スループットなデータアクセスとスケールアウトアーキテクチャ: VAST AI OSは、大量のデータに高速にアクセスできるだけでなく、必要に応じてシステム規模を柔軟に拡張(スケールアウト)できる設計になっています。これにより、ペタバイト級のビデオデータであっても、滞りなく処理することが可能です。
  2. データベースサービスとリアルタイム処理・オーケストレーションの統合: VAST AI OSは、単なるストレージシステムではなく、データ管理のためのデータベースサービスや、データの流れを効率的に調整(オーケストレーション)する機能、そしてリアルタイムでのデータ処理能力を統合しています。これにより、データが取り込まれた瞬間から、圧縮、分析、検索までの一連のプロセスをスムーズに実行できます。
  3. VLM(Video Language Model)を活用したセマンティック・キュレーション: 大規模な映像データに対して、VLM(ビデオ言語モデル)を活用することで「セマンティック・キュレーション」が可能になります。これは、映像の内容をAIが理解し、意味に基づいてデータを整理・分類することです。例えば、「特定の車種が映っているシーン」「人が横断歩道を渡っているシーン」といった意味情報で映像をタグ付けし、管理できるようになります。

これにより、膨大なビデオデータの中から特定の情報(例えば、過去に発生した特定の交通状況の映像や、特定の物体が検出された映像)を、検索、フィルタリング、優先度付けといった形でペタバイト規模のデータから高速に探し出すことが可能になります。これは、AIモデルのトレーニングデータの準備や、特定の事象の分析において、開発者や研究者の作業効率を劇的に向上させるでしょう。

NVIDIA GTC 2026でビーマー社の専門家と直接対話する機会

もし、自動運転、ロボティクス、スマートスペースなどの分野で、ペタバイト級のビデオデータ管理に課題を抱えている企業や研究機関があるならば、NVIDIA GTC 2026はビーマー社のビデオデータ専門家と直接相談できる貴重な機会となるでしょう。

ビーマー社のブース(3109)では、最新のML-Safeビデオデータ圧縮技術に関する詳細な説明やデモンストレーションが実施されます。面談の予約は、以下のオンラインフォームから受け付けています。

ジャパン・トゥエンティワン株式会社(J21)は、ビーマー社の革新的な技術が日本の企業や研究機関に広く活用されるよう、今後も継続して支援していく方針です。

ビーマー社とは:ビデオ最適化技術の世界的リーダー

ビーマー社(Beamr Imaging, LTD.)は、イスラエルのヘルツェリアに本拠を置くNASDAQ上場企業であり、コンテンツアダプティブビデオソリューションの世界的リーダーとして知られています。同社は、その革新的な技術力が高く評価されており、2021年には「テクノロジー&エンジニアリング・エミー賞」や「Seagate Lyve Innovator of the Year」を受賞しています。これらの受賞は、同社の技術がメディア・エンターテインメント業界やデータストレージ業界に与えた影響の大きさを物語っています。

ビーマー社の技術は、53件もの関連特許に裏付けられており、視覚的な品質を維持したまま、最大50%ものビットレート削減(データ量の削減)を可能にします。この技術は、今回のフィジカルAI分野だけでなく、ストリーミング配信、クラウドストレージ、メディア制作など、幅広い分野でビデオデータ管理の効率化とコスト削減に貢献しています。

ジャパン・トゥエンティワン株式会社(J21)の役割

ジャパン・トゥエンティワン株式会社(J21)は、1992年9月に創業された企業で、世界中の革新的な商材を通じて社会課題を解決することを企業理念としています。主にイスラエルをはじめとする世界最先端のハイテク企業とパートナーシップを結び、その技術や製品を日本市場で展開し、ビジネス開発と販売を行っています。

J21は、「モビリティ事業」「スマートインフラ事業」「EC・ソフトウェア事業」「ヘルスケア事業」の4つの事業領域を展開しており、ビーマー社のビデオ最適化技術は、その「EC・ソフトウェア事業」の一部として、日本の顧客に提供されています。J21は、ビーマー社の高度な技術を国内の企業が安心して利用できるよう、サポート体制を構築し、導入から運用までを支援しています。

まとめ:AIとデータの未来を拓くビーマー社の技術

ビーマー社の「ML-Safeビデオデータ圧縮」技術は、フィジカルAIの発展において極めて重要な役割を果たす可能性を秘めています。自動運転車、ロボット、スマートスペースといった分野では、高品質なビデオデータがAIモデルの精度と信頼性を保証するために不可欠です。しかし、その膨大なデータ量は、ストレージコスト、ネットワーク帯域、処理能力といった面で大きな課題となっていました。

ML-Safe圧縮は、AIの精度を損なうことなく、これらのデータ課題を効率的に解決します。最大50%のファイルサイズ削減は、コスト削減とデータ転送の高速化に直結し、GPUアクセラレーションによる高速処理は、AI開発のサイクルを加速させます。VAST Data社との共同デモで示される「取り込み時ML-Safe圧縮」パイプラインは、Video RAG/VSSのような高度なAIアプリケーションにおいて、データの取り込みから分析・検索までを一貫して効率化する未来を示しています。

この技術が広く普及することで、フィジカルAIの開発はさらに加速し、より安全で、より賢く、より効率的な社会の実現に貢献することでしょう。ビーマー社とジャパン・トゥエンティワン株式会社の今後の取り組みに注目が集まります。

タイトルとURLをコピーしました