製造業の未来を拓く「フィジカルAI」:3社がAWSプログラムに採択
日本の製造業は、世界に誇る技術力を持ちながらも、少子高齢化による労働力不足や熟練技術者の技能伝承といった深刻な課題に直面しています。特に、工場で活躍するロボットの制御には高度なプログラミング(ティーチング)が必要で、これが現場での柔軟な運用を妨げる一因となっていました。
このような状況を打開するため、国産マルチモーダルAI開発を手がけるカラクリ株式会社(以下、カラクリ)、トヨタグループの主要企業である株式会社ジェイテクト(以下、ジェイテクト)、そしてグローバルAI企業であるUpstage AI株式会社(以下、Upstage)の3社が、アマゾン ウェブ サービス ジャパン合同会社(以下、AWSジャパン)が提供する「フィジカルAI開発支援プログラム by AWSジャパン」に共同で採択されました。
この画期的な取り組みは、AI技術を「物理的な世界」に応用する「フィジカルAI」を活用し、製造現場のロボットを「言葉」や「視覚情報」で直感的に操作できる未来を目指しています。具体的には、カラクリがカスタマーサポートAIで培った「意図理解」や「画像認識」技術を、製造現場のロボット制御に転用するというものです。
「フィジカルAI開発支援プログラム by AWSジャパン」とは?
このプログラムは、AWSジャパンが日本に法人や拠点を持つ企業・団体を対象に実施するものです。物理的な世界で動作するAI、特に「Vision Language Action(VLA)」といったロボットの基盤となるAIモデルの開発を強力に後押しするために設計されています。
プログラムでは、技術的な支援はもちろんのこと、AIモデル開発に必要なAWSのクラウドサービス利用料(AWSクレジット)の提供(プログラム全体で最大600万USドル規模)、フィジカルAIに特化したコミュニティの形成、そして開発された技術の市場投入支援まで、多角的なサポートが行われます。支援期間は2026年3月から約6ヶ月間とされており、同年7月には成果発表会が予定されています。
このプログラムに関する詳細は、以下のAWSの公式ブログで確認できます。
AWSジャパン フィジカルAI開発支援プログラム
なぜ今、フィジカルAIが日本の製造業に求められるのか?
日本の製造業は、長年にわたり培ってきた「匠の技」と「現場の知」によって世界のトップランナーとして君臨してきました。しかし、前述の通り、深刻な労働力不足と熟練技術者の高齢化による技能伝承の難しさが、その競争力を脅かしています。
従来の産業用ロボットは、決められた作業を正確にこなすために、非常に細かくプログラミング(ティーチング)する必要がありました。このティーチング作業は専門知識と多くの時間を要し、生産ラインの変更や多品種少量生産への対応を難しくしていました。つまり、ロボットは非常に高性能であるにもかかわらず、その「柔軟性」が課題だったのです。
フィジカルAIは、この課題を解決する鍵となります。AIが周囲の状況を「見て(Vision)」、人間の指示を「理解し(Language)」、適切な「行動(Action)」を自律的に判断して実行できるようになれば、専門知識がない人でも直感的にロボットを操作できるようになります。これにより、生産現場のロボットはより柔軟に、そして効率的に稼働し、日本の製造業が抱える構造的な問題の解決に大きく貢献することが期待されています。
カラクリ・ジェイテクト・Upstage 3社共同プロジェクトの全貌
今回の共同プロジェクトでは、それぞれの分野で強みを持つ3社が協力し、製造現場におけるフィジカルAIの社会実装を目指します。具体的には、ジェイテクトの工場を実証フィールドとして、自律型・適応型生産システムの実現を目指します。
技術の核:カスタマーサポートAIから製造現場AIへの転用
カラクリがフィジカルAI領域に参入する背景には、同社がこれまでカスタマーサポート向けに開発してきたAI技術と、ロボット制御に用いられるAI技術との間に高い親和性があるからです。
カラクリが開発してきた「コンピューター操作エージェント(CUA)モデル」は、画面上の画像から情報を認識し、ユーザーが自然な言葉で与える指示から「どこにマウスを動かし、何をクリックするか」といった具体的な操作を自律的に生成するAIです。このCUAモデルの基本的な仕組みは、ロボット制御で利用される「Vision-Language-Action(VLA)モデル」と共通しています。
VLAモデルとは、「画像(Vision)を見て、言語(Language)で人間が何をしたいのかを理解し、その指示に基づいて動作(Action)を生成する」という一連のプロセスを行うAIモデルです。CUAモデルがコンピューター画面という仮想空間で「見る・理解する・操作する」を行っていたのに対し、VLAモデルは現実世界の物理空間で同じことを行うイメージです。
この技術転用により、以下の3つのポイントがフィジカルAIの開発を大きく加速させると考えられています。
-
意図理解技術:カスタマーサポート領域で培われた、曖昧な指示から真の意図を正確に汲み取る技術は、製造現場での「あれをそっちに運んで」といった直感的な指示をロボットが理解する上で不可欠です。
-
画像・空間認識:コンピューター画面上の要素を認識する技術を、製造ラインのリアルタイムな状況把握に応用します。CG合成データを活用することで、効率的な学習も可能になります。
-
高効率トレーニング:AWSのAIチップ「Trainium」の活用において世界トップクラスの技術力を持つカラクリは、限られたリソースで高性能なAIモデルを開発する能力を有しています。

3社連携体制とそれぞれの役割
本プロジェクトでは、各社の専門性と強みを最大限に活かした連携体制が構築されています。
-
ジェイテクト(実証フィールドの提供):自動車部品、軸受、工作機械などの製造現場と、そこで長年培われてきた豊富なドメイン知識を提供します。実際の製造ラインにおける具体的な課題の抽出や、AIを検証するための実証環境を提供します。
-
Upstage(モデル開発支援):製造現場に存在する多様な「非構造データ」(例えば、文書、画像、音声など、AIがそのままでは処理しにくい形式のデータ)を、AIが活用しやすい形に変換する技術を提供します。大規模言語モデル(LLM)開発の知見に基づき、技術支援とデータの資産化を推進します。
-
カラクリ(AIモデル開発):CUA/VLAモデル技術を基盤としたロボット制御AIの開発を担います。また、AWS Trainiumを活用した高効率なAIトレーニング技術を提供し、AIモデルの性能向上に貢献します。
共同開発の具体的な内容
3社は以下の取り組みを通じて、フィジカルAIの社会実装を加速させます。
-
Vision Language Action(VLA)の活用:画像、言語、動作を統合的に学習・推論できるマルチモーダル生成AIを活用することで、複雑な製造プロセスの自動化と最適化を目指します。
-
仮想空間での高速学習(Sim2Real)による試作コストの削減:現実世界でAIを学習させるには時間とコストがかかりますが、シミュレーション環境(仮想空間)でAIモデルを高速に学習させ、その学習成果を実環境に転用する「Sim2Real」技術を活用します。これにより、AIモデルの開発コストと試作期間を大幅に短縮します。
-
現場データの資産化とAI-Ready化:ジェイテクトの工場に蓄積されている多様で高精度なデータを、AIが最大限に活用できる形式に変換し、現場データに基づいた専用のAIモデルを構築します。これにより、各工場や生産ラインの特性に合わせた最適なAIが実現されます。
各社のコメントから見るプロジェクトへの期待
この共同プロジェクトにかける各社の強い意気込みと、日本の製造業の未来への展望が、各社からのコメントからも読み取れます。
株式会社ジェイテクト イノベーション本部 研究開発センター長 小野﨑 徹 氏
小野﨑氏は、日本の少子高齢化による生産年齢人口の減少に対し、ジェイテクトが培ってきた「匠の技」と「現場の知」をフィジカルAIとして昇華させる必要性を強調しています。特に、自動車部品・軸受・工作機械の製造現場に蓄積された膨大な「暗黙知」(言葉や文字で表現しにくい経験や勘、コツ)を、UpstageのDocument AI技術とカラクリの生成AI技術を組み合わせることで、AIが扱える「形式知」へと変換し、フィジカルAIの実装を加速させたいと述べています。この取り組みを、日本のモノづくりの競争力を再定義する第一歩と位置づけ、製造業におけるフィジカルAI実装の新たなモデルを共創していく考えです。
Upstage AI 株式会社 代表取締役 松下紘之 氏
松下氏は、製造業においてデータが非常に重要であるにもかかわらず、その多くが文書やログ、分断されたシステムの中に閉じ込められている現状を指摘しています。Upstageの強みは、こうした非構造情報や現場に眠る暗黙知を、AIが活用できるインテリジェンスへと変換することにあると説明しています。ジェイテクトの製造業での知見、カラクリの生成AI開発力、そしてUpstageのDocument AI技術を組み合わせることで、フィジカルAIを単なるコンセプトに留めず、製造現場へと確実に実装していく機会になると語っています。
カラクリ株式会社 CPO 中山智文 氏
中山氏は、日本のものづくりの強みは「現場力」にあると強調しています。現場が自ら改善サイクルを回しながら複雑な問題を解決してきた力を、AIの時代にも活かすためには、現場の人間がAIを直感的に使いこなせる仕組みが不可欠だと述べています。カスタマーサポート領域で培った「人の言葉の意図を理解し、適切に応える」技術は、ロボットを人間の言葉で制御する技術にそのまま転用できると説明。Upstageのデータ構造化技術、そしてジェイテクトの世界トップクラスの製造現場と協力することで、日本発のフィジカルAIの新しい形を世界に示していきたいと意気込みを語っています。
各社概要
株式会社ジェイテクト
-
所在地:愛知県刈谷市朝日町1丁目1番地
-
代表者:取締役社長 近藤禎人
-
事業内容:ステアリング、ドライブライン、軸受、工作機械、電子制御機器等の開発・製造・販売。自動車部品のステアリングシステムにおいては世界シェアNo.1。
Upstage AI株式会社
-
所在地:東京都港区
-
代表者:代表取締役 松下紘之
-
事業内容:安全で高性能なLLMおよびドキュメントAIプラットフォームの提供。AmazonやAMDからの出資を受け、国内開発LLM「Syn Pro」やDocument Parseなど企業向けAIプラットフォームを展開。
カラクリ株式会社
-
所在地:東京都中央区築地2-7-3 Camel築地II 5F
-
代表者:代表取締役CEO 小田志門
-
設立:2016年10月
-
事業内容:カスタマーサポート特化型AI「KARAKURI」シリーズの開発・提供・運営、大規模言語モデル(LLM)の研究開発。
まとめ
カラクリ、ジェイテクト、Upstageの3社が共同で取り組むこのフィジカルAI開発プロジェクトは、日本の製造業が直面する課題に対する強力な解決策となる可能性を秘めています。カスタマーサポートAIで培われた「意図理解」と「画像認識」の技術を製造現場に転用するという発想は、AI活用の新たな地平を切り開くものです。
このプロジェクトによって、熟練技術者の知識や経験がAIを通じて次世代に伝承され、ロボットがより人間に近い感覚で作業できるようになることで、生産現場の効率化、柔軟性の向上、そして新たな価値創造が期待されます。AIと人間の協調によって、日本のものづくりがさらに進化し、世界をリードする存在であり続けるための重要な一歩となるでしょう。今後の進展に注目が集まります。

