サーバー不要で産業AIを導入！「Catalyst」がスマート農業・産業ロボットの未来を拓くLLM/VLA推論サービス
なぜ今、サーバーレスLLM推論が必要なのか？産業現場の課題
「Catalyst」の３つの大きな特徴：サーバーレスで手軽に、高性能に
現場にAIを届ける「Edge AI Pod」とdocomo MEC連携
1. セキュリティと低レイテンシを実現するEdge AI Pod
2. docomo MEC連携で実現する閉域ネットワーク（対応予定）
「Catalyst」がターゲットとする領域：デバイス制御・Physical AI
「Catalyst」を支える最先端ハードウェアの力
1. Tenstorrent LoudBox（Wormholeアーキテクチャ）の詳細
2. NVIDIA H100 GPUの詳細
VLAモデルでロボットの「見る・話す・動く」を統合
具体的な活用シーン：スマート農業と産業ロボティクス
1. スマート農業
2. 産業ロボティクス
開発・販売体制
サービス概要まとめ
関連情報

サーバー不要で産業AIを導入！「Catalyst」がスマート農業・産業ロボットの未来を拓くLLM/VLA推論サービス

現代の産業現場において、AIの活用はもはや不可欠な要素となりつつあります。特に、人間のように「見て、考えて、行動する」能力を持つ大規模言語モデル（LLM）やVision-Language-Action（VLA）モデルへの注目は高まる一方です。しかし、これらの高度なAIを実際の現場に導入するには、高性能なコンピューター設備の準備や専門知識が必要で、多くの企業にとって大きなハードルとなっていました。

そんな課題を解決すべく、AI・Blockchain・Cultivation（農業/AI学習）領域の技術開発を手掛けるABC株式会社は、2026年4月1日より、サーバー構築不要でLLM/VLAモデルをAPI経由で利用できる画期的なServerless Inferenceサービス「Catalyst（カタリスト）」の提供を開始します。このサービスは、スマート農業や産業ロボットといった、リアルタイム性とセキュリティが特に求められる分野に特化しており、産業現場のAI活用を大きく加速させることが期待されています。

なぜ今、サーバーレスLLM推論が必要なのか？産業現場の課題

近年、LLMやVLAモデルは、その高い情報処理能力や判断能力から、様々な産業分野での応用が期待されています。例えば、農業用ロボットが作物の状態を判断して収穫作業を行ったり、工場ロボットが異常を検知して自動で対応したりするなど、その可能性は無限大です。

しかし、これらの先進的なAIモデルを自社で導入・運用するには、いくつかの大きな課題があります。

高額なコストと専門知識：LLM/VLAモデルの推論には、NVIDIA H100のような高性能なGPU（Graphics Processing Unit）を搭載したサーバーが不可欠です。これらのGPUサーバーは非常に高価であり、導入には初期費用だけでなく、電力消費や冷却設備などの運用コストもかかります。さらに、サーバーの構築、AIモデルのデプロイ（配置）、運用、メンテナンスには専門的な知識を持った人材が求められます。
レイテンシ（遅延）の問題：農業用ロボットや産業用ロボットの自律制御では、カメラ映像の解析から動作指令の生成までを、ごく短時間（数十ミリ秒単位）で処理する必要があります。従来のクラウドサービスでは、データがインターネットを経由して遠隔地のデータセンターまで往復するため、どうしても通信に遅延が発生し、リアルタイム性が損なわれる恐れがありました。
データプライバシーとセキュリティ：営農データや生産ラインの機密情報など、産業現場で扱われるデータには高い機密性が求められます。これらのデータを外部のクラウドサービスに送信することに抵抗を感じる企業も少なくありません。

ABC株式会社は、これまでAIオーケストレーションやVLAモデルの研究開発で培った知見を活かし、「まずはAPIで手軽に始められ、必要に応じて現場のエッジ環境にも拡張できる」というコンセプトのもと、これらの課題を解決する推論基盤として「Catalyst」を開発しました。

「Catalyst」の３つの大きな特徴：サーバーレスで手軽に、高性能に

「Catalyst」は、お客様がインフラの構築や運用を意識することなく、AI推論を最大限に活用できる「サーバーレス」というコンセプトを核としています。これにより、産業現場でのAI導入のハードルを大幅に下げます。

1. GPUサーバー不要！API一つで即座に利用開始

「Catalyst」の最大の特長は、お客様がGPUサーバーを一切調達・構築・運用する必要がない点です。通常、LLMやVLAモデルを利用するには、高性能なGPUを搭載したサーバーを準備し、複雑な設定を行う必要があります。しかし、「Catalyst」では、APIキーを発行するだけで、すぐにAI推論機能を利用できます。

これは、開発中のアプリケーションやロボット制御システムから、まるでウェブサイトの情報を取得するのと同じように、簡単なAPIコール一つでLLM/VLAモデルの推論を呼び出せることを意味します。これにより、AI導入にかかる時間、コスト、そして専門知識の負担を劇的に削減し、企業はAIの活用そのものに集中できるようになります。

2. 多様なオープンソースLLM/VLAモデルに対応

「Catalyst」は、世界中で開発されている様々なオープンソースのLLMやVLAモデルに幅広く対応しています。具体的には、Alibaba Cloudが開発した「Qwen（クエン）」、DeepSeekの「DeepSeek」、Metaの「Llama（ラマ）」といった主要なLLMをサポート。

さらに、ロボットの目となるVision（視覚）、指示を理解するLanguage（言語）、そして実際に動作するAction（行動）を統合的に処理するVLAモデルとして、「OpenVLA」や「SmolVLA」なども利用可能です。これにより、お客様は特定の用途や要件に応じて最適なモデルを選択し、柔軟にAIシステムを構築できます。

3. 産業用途に最適化された推論基盤

「Catalyst」は、一般的なチャットボットや消費者向けの対話サービスとは異なり、スマート農業や産業ロボットのデバイス制御、つまり機械同士が直接通信し合う「M2M（Machine-to-Machine）通信」を前提としたワークロードに最適化されています。その基盤には、Tenstorrent社製AIアクセラレータ「LoudBox（ワームホールアーキテクチャ）」と、業界標準のNVIDIA H100 GPUが組み合わされています。

この高性能な組み合わせにより、「Catalyst」は高速かつ安定したAI推論を提供し、リアルタイム性が求められる産業現場のニーズに応えます。また、Tenstorrent LoudBoxの高い電力効率とNVIDIA H100の推論性能を組み合わせることで、主要なクラウドサービスと比較しても大幅なコスト削減を実現し、経済的なAI導入を支援します。

現場にAIを届ける「Edge AI Pod」とdocomo MEC連携

「Catalyst」はサーバーレスのクラウド環境での利用が基本ですが、より高いセキュリティ要件や極限の低レイテンシが求められるケースのために、お客様の現場にAI推論環境を直接設置する「エッジ運用」にも対応しています。

セキュリティと低レイテンシを実現するEdge AI Pod

エッジAIとは、AIの処理をクラウドではなく、データの発生源に近い場所（エッジ）で行う技術です。Catalystでは、このエッジAIを実現するために、専用の推論ノード「Edge AI Pod（エッジAIポッド）」を提供します。

Edge AI Podは、小規模なラックユニットやコンパクトなコンテナ筐体として設計されており、ビニールハウスの管理棟、畑の近くの作業小屋、工場のフロア脇など、これまでサーバーの設置が難しかった様々な現場環境にも直接配置できます。これにより、推論処理を現場で完結させることが可能となり、データが外部に出ないセキュアな運用と、クラウドへの往復通信を排除した超低レイテンシ（遅延が非常に少ない）応答を実現します。

docomo MEC連携で実現する閉域ネットワーク（対応予定）

Edge AI Podを活用したエッジ運用は、今後、NTTドコモが提供するMulti-access Edge Computing（MEC）基盤「docomo MEC」への対応が予定されています。docomo MECは、ドコモのネットワーク内にサーバーを配置し、MECダイレクトという専用の接続方法でダイレクトアクセスを可能にするサービスです。これにより、Catalystは以下のメリットを提供します。

閉域通信：AI推論のリクエストとレスポンスがインターネットを経由せず、ドコモの閉域ネットワーク内で完結します。これにより、営農データやロボット制御信号といった機密性の高いデータを、より安全に処理できます。
スマート農業への導入容易性：モバイル回線を活用するため、固定回線の敷設が困難なビニールハウスや広い圃場でも、既存の携帯電話回線インフラを利用してAI推論環境を即座に構築できます。
ネットワーク品質の安定性：ドコモの商用モバイルネットワークを基盤とするため、広範囲なカバレッジと安定した通信品質が確保され、信頼性の高いAI運用が期待できます。

これにより、特にスマート農業分野でのAI導入がさらに加速し、より多くの農家や企業が最先端のAI技術を活用できるようになるでしょう。

「Catalyst」がターゲットとする領域：デバイス制御・Physical AI

「Catalyst」は、一般的なチャットボットのように人間との対話を目的としたAIサービスではありません。その真価を発揮するのは、ロボットやセンサーといった物理的なデバイスが直接AIモデルと通信し、現場の状況を「認識」し、「判断」を下し、具体的な「動作制御」を行う「デバイス制御・Physical AI領域」です。

例えば、カメラ映像をVLAモデルで解析してロボットアームの最適な動作指令を生成したり、多数のセンサーデータをLLMで統合的に分析して、その場の状況に応じた自律的な農作業計画を立案したりするようなユースケースが想定されます。これは、機械が機械と直接連携するM2M通信を前提としており、推論のレイテンシ（遅延）、スループット（処理能力）、デバイス連携プロトコル（通信規約）といった点で、産業用途に特化した設計が施されています。これにより、現場でのスムーズかつ正確なAI駆動型オペレーションが実現します。

「Catalyst」を支える最先端ハードウェアの力

「Catalyst」の高性能は、最先端のAIアクセラレータとGPUによって支えられています。これらのハードウェアが、複雑なLLMやVLAモデルの推論を高速かつ効率的に実行します。

Tenstorrent LoudBox（Wormholeアーキテクチャ）の詳細

Tenstorrent社が開発した「Wormhole（ワームホール）」は、RISC-Vベースの「Tensix（テンシックス）コア」を採用した次世代のAIアクセラレータです。RISC-Vは、オープンソースで設計されたプロセッサの命令セットアーキテクチャで、柔軟性とカスタマイズ性に優れています。

各Tensixコアには、演算ユニット、Network-on-Chip（NoC：チップ内のデータ通信網）、ローカルキャッシュ（高速な一時記憶領域）、軽量なRISC-Vコアが内蔵されており、チップ内でのデータ移動効率が非常に高いのが特長です。LoudBoxは、このWormhole n300カードを4枚メッシュ接続（網の目のようにつなぐ）した構成で、合計96GBのGDDR6メモリ、768MBのSRAMを搭載し、最大で1,864 FP8 TFLOPS（テラフロップス：1秒間に1兆回以上の浮動小数点演算が可能）という驚異的な演算性能を発揮します。チップ間は3.2Tbps（テラビット毎秒）の高速イーサネットで接続され、複数のチップがまるで1つの大規模なプロセッサのように動作するスケーラブルな設計が、大規模なAIモデルの処理に貢献します。さらに、オープンソースのソフトウェアスタック「TT-Metalium SDK」により、モデルの最適化やカスタマイズも柔軟に行えます。

NVIDIA H100 GPUの詳細

NVIDIA H100は、Hopper（ホッパー）アーキテクチャを採用したデータセンター向けのGPUであり、AI分野、特にTransformer（トランスフォーマー）モデル（LLMの基盤となる技術）の推論や学習において、業界標準のパフォーマンスを提供しています。FP8演算（8ビット浮動小数点演算）では最大3,958 TFLOPSという極めて高い性能を誇り、大規模なLLMの高速推論に最適です。

H100は、特にバッチ処理（複数の処理をまとめて実行する）や、非常に大きなAIモデルの推論など、高いスループット（単位時間あたりの処理量）が求められるワークロードにおいてその能力を発揮します。Tenstorrent LoudBoxとNVIDIA H100を組み合わせることで、「Catalyst」は多様なAIワークロードに対して、最適な性能と効率を提供できる基盤となっています。

VLAモデルでロボットの「見る・話す・動く」を統合

「Catalyst」は、特にVLA（Vision-Language-Action）モデルの推論基盤に注力しています。VLAモデルは、AIが人間のように周囲の環境を「見て」（Vision）、人間の指示や状況を「言語で理解し」（Language）、それに基づいて適切な「行動を生成する」（Action）という、3つの異なるモダリティ（情報形式）を統合的に処理するAIモデルです。

従来のロボット制御は、あらかじめプログラムされた動作パターンに依存しており、予期せぬ状況や未知の環境への柔軟な対応が困難でした。しかし、VLAモデルは、カメラ映像のような視覚情報と、自然言語による指示を統合的に理解し、その場の状況に合わせた最適な動作を生成することで、ロボットの汎用的な知能を実現します。これにより、ロボットはより自律的に、より複雑なタスクを実行できるようになります。Catalystの推論基盤では、「OpenVLA」や「SmolVLA」といったオープンソースのVLAモデルに対応し、特に農業用ロボットや産業用ロボットの自律制御での活用を想定しています。

具体的な活用シーン：スマート農業と産業ロボティクス

「Catalyst」は、その設計思想から、特にスマート農業と産業ロボティクス分野で大きな変革をもたらすことが期待されています。

スマート農業

果実収穫ロボット：ロボットに搭載されたカメラが果実の映像を捉え、VLAモデルがその映像から果実の成熟度を正確に判定します。そして、最適な収穫時期や方法を判断し、ロボットアームに「優しく、確実に」収穫する動作指令を自動で生成します。これにより、人手不足の解消と収穫作業の効率化が図られます。
圃場巡回・モニタリング：自律走行ロボットがビニールハウスや広大な圃場（ほじょう）内を定期的に巡回し、搭載されたセンサーやカメラで取得したデータをリアルタイムで分析します。VLAモデルやLLMが、作物の生育状況、病害虫の発生、土壌の状態などを検知・報告し、異常があれば即座にアラートを発します。これにより、早期発見・早期対応が可能となり、収量の安定化に貢献します。
農作業計画の最適化：気象データ、土壌データ、作物の生育データなど、様々な情報をLLMで統合的に分析します。これにより、AIが「いつ、どれくらいの水やりが必要か」「どのタイミングで肥料を施すのが最適か」といった、精度の高い灌水（かんすい）や施肥スケジュールを自動で立案し、最適な農作業をサポートします。

産業ロボティクス

製造ラインの自律検品：製造ラインを流れる製品のカメラ映像をVLAモデルが解析し、傷や汚れ、形状の異常といった不良品を瞬時に検知します。さらに、不良品を自動でピッキング（取り除く）するロボットアームの動作指令を生成し、製造プロセスの品質管理と効率化を飛躍的に向上させます。
物流倉庫の自動仕分け：自然言語による「〇〇をAの棚に、△△をBの棚に」といった作業指示をLLMが理解し、ロボットが指示された荷物を正確に認識、分類、そして指定された場所へ搬送します。これにより、物流倉庫における人手による作業負担を軽減し、仕分けミスを減らし、作業効率を大幅に向上させます。

Catalystの専属販売代理店であるアグリノード株式会社は、農業支援プラットフォーム「ハタスケ」も展開しており、Catalystとハタスケの連携を通じて、農業DX（デジタルトランスフォーメーション）の推進とPhysical AIの社会実装を一体的に進めていく方針です。

開発・販売体制

「Catalyst」は、ABC株式会社とアグリノード株式会社の連携によって、お客様に最適な形で提供されます。

開発・運用：ABC株式会社が、推論基盤の開発とインフラの安定運用に専念します。最先端のAI技術を駆使し、高品質なサービス提供の根幹を支えます。
販売・導入支援：アグリノード株式会社が専属販売代理店として、お客様へのご提案、導入支援、そして運用後のサポートを一貫して担当します。農業や産業現場の実情に即したきめ細やかなサポート体制を構築することで、スムーズなAI導入を支援します。

サービス概要まとめ

「Catalyst」は、産業現場のAI活用を加速させるための強力なツールとなるでしょう。その主な仕様は以下の通りです。

サービス名：Catalyst
提供開始日：2026年4月1日
対象領域：スマート農業、産業ロボティクス等のデバイス制御・Physical AI領域（一般的なチャットサービス用途は対象外）
対応モデル：Qwen、DeepSeek、Llama等のオープンソースLLM / OpenVLA、SmolVLA等のVLAモデル
推論基盤：Tenstorrent LoudBox（Wormhole n300 x4構成）/ NVIDIA H100搭載サーバー
利用環境：サーバーレス（API経由のクラウド推論）を基本とし、専用Edge AI Pod（ラックマウント型・コンテナ型）によるエッジ運用にも対応
ネットワーク：docomo MECによる閉域ネットワーク環境に対応予定
料金体系：従量課金制（詳細は別途お問い合わせください）
販売代理店：アグリノード株式会社
開発・運用：ABC株式会社