JAPAN AI株式会社は、同社が独自開発した国産AIエージェント基盤「JAPAN AI Code」が、ソフトウェア開発AIの国際的な評価基準である「SWE-bench Verified」ベンチマークにおいて、全500問の評価で80.2%という高い解決率を達成したことを発表しました。この成果は、国内で独自開発されたAIエージェント基盤として世界最高水準の性能を実証するものです。

JAPAN AI Codeとは?ソフトウェア開発を変革するAIエージェント
「JAPAN AI Code」は、JAPAN AIが独自に開発したAIエージェント基盤の上で動作する、ソフトウェア開発を支援するAIエージェントです。従来のコード補完ツールとは一線を画し、より高度で自律的な機能を備えています。
AIエージェントとは、特定の目標を達成するために、自律的に判断し、行動できる人工知能プログラムのことです。JAPAN AI Codeの場合、ソフトウェア開発における課題を単に「コードを書く」だけでなく、「課題を理解し、その原因を調査し、解決策を実装し、そしてそれが正しく動作するかを検証する」という一連のプロセスを一貫して自律的に実行することができます。
具体的には、バグの根本原因を探し出したり、既存のコードを改善するためのレビューを行ったり、新しい機能をテストするためのコードを作成したり、さらにはアプリケーション全体の開発まで、ソフトウェア開発の幅広い業務をサポートします。
また、JAPAN AI Codeは、同社が提供するAIプラットフォーム「JAPAN AI STUDIO」と連携しています。これにより、企業が持つ独自の知識やドキュメント、これまでのプロジェクト情報などにアクセスしながら作業を進めることが可能です。単なるコーディング支援ツールではなく、企業の文脈や状況を理解した上で開発を支援する、企業向けのAIエージェントとして機能します。
国際ベンチマーク「SWE-bench Verified」とは?なぜ80.2%がすごいのか
SWE-bench Verified(https://www.swebench.com/)は、AIが実際のソフトウェア開発の課題をどの程度解決できるかを測るための国際的な評価基準です。このベンチマークは、世界中で広く利用されているオープンソースプロジェクト(例:Django、Matplotlib、scikit-learnなど)において、GitHubで実際に報告されたバグや機能要望の中から、人間の専門家が厳選した500問で構成されています。
AIエージェントには、これらの問題の説明文と、対象となるリポジトリのソースコードのみが与えられます。AIは、この限られた情報だけを頼りに、コード全体を探索し、問題の原因を特定し、修正を実装し、そして既存のテストがすべて成功することを確認するまでの一連の作業を、一切のヒントなしに自律的に完了しなければなりません。つまり、AIが実務レベルのソフトウェアエンジニアとしてどこまで機能するかを評価する、非常に厳しい試験と言えるでしょう。
JAPAN AI CodeがこのSWE-bench Verifiedで達成した解決率80.2%は、全500問中401問を解決したことを意味します。これは、AIエージェントが複雑な現実世界のソフトウェア開発課題に対して、非常に高い精度で対応できる能力を持っていることを客観的に示すものです。
他のAIエージェントとの性能比較
SWE-bench Verifiedの公式リーダーボード(2026年2月時点)によると、JAPAN AI Codeは他の主要なコーディングAIエージェントと比較しても、非常に高い解答率を示しています。
| コーディングAIエージェント | 解答率 |
|---|---|
| JAPAN AI Code | 80.20% |
| TRAE + Doubao-Seed-Code | 78.80% |
| live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) | 77.40% |
| TRAE | 75.20% |
| Lingxi-v1.5_claude-4-sonnet-20250514 | 74.60% |
| JoyCode | 74.60% |
また、各AIモデル提供元が自社のモデルに最適化したAIエージェント構成で評価したSWE-bench Verifiedスコア(参考値)と比較しても、JAPAN AI Codeは同等レベルの成果を出しています。
| AIモデル名 | 解答率 |
|---|---|
| Claude Opus 4.5 | 80.9% |
| JAPAN AI Code | 80.2% |
| GPT5.2 | 80.0% |
| Gemini 3 Flash | 78.0% |
この比較からわかるように、JAPAN AI Codeは、AIモデルの開発元が自社モデル向けに最適化した結果とほぼ同等のスコアを実現しています。これは、基盤となるAIモデルの性能だけでなく、JAPAN AIが独自開発した「AIエージェント基盤」そのものの技術力が世界最高水準にあることを客観的に示しています。
JAPAN AI独自のAIエージェント基盤:なぜ高い解決率を達成できたのか
JAPAN AI Codeの最大の特長は、JAPAN AIがゼロから独自に開発したAIエージェント基盤の上で動作している点にあります。多くのAIコーディングツールが、既存のAIモデルのAPIを呼び出すシンプルな構成にとどまり、モデル自体の性能に大きく依存しているのに対し、JAPAN AIのエージェント基盤は、AIモデルの上に独自の技術レイヤーを構築することで、AIモデル単体では到達できないような高い精度と安定性を実現しています。
この独自のAIエージェント基盤を支える主な技術要素は以下の通りです。
(1) マルチAIエージェント連携
複雑なソフトウェア開発タスクは、多くの場合、複数の異なる専門知識を必要とします。JAPAN AI Codeは、このような複雑なタスクを、コードの構造分析、テスト要件の抽出、修正パッチの検証といった複数の専門エージェントに分割します。そして、これらの専門エージェントが並行して作業を進め、互いに協力し合うことで、より効率的かつ正確に問題解決にあたります。
(2) 動作ツールの最適な選択
ソフトウェア開発には、ファイル操作、コード検索、テスト実行、API連携など、多種多様なツールが使われます。JAPAN AI Codeは、100種類以上のツールの中から、与えられたタスクに応じて最も適切なツールを自動的に選択し、実行することができます。これにより、開発に必要なあらゆる操作をAIが自律的に判断し、実行することが可能になります。
(3) コンテキスト管理
ソフトウェア開発は、時に数時間、数日にわたる長い作業になることがあります。JAPAN AI Codeは、文脈の要約・圧縮技術を駆使することで、長時間にわたる作業でも関連する情報を失うことなく維持し、一貫性のある作業を実現します。これにより、AIが途中で状況を見失うことなく、効率的にタスクを完了させることができます。
(4) マルチAIモデル対応
JAPAN AI Codeは、Claude、GPT、Gemini、Kimiといった主要なAIモデルだけでなく、オープンソースのAIモデルにも対応しています。これにより、タスクの重要度や利用できる予算に応じて、最適なAIモデルを選択して利用することが可能です。今回のSWE-bench Verifiedの評価では、Claude 4.5 Opusを主軸とし、GPT-5.2 Codexをサブエージェントとして組み合わせることで、高い成果を示しました。
これらの技術要素が組み合わさることで、JAPAN AI CodeはSWE-benchのような標準的な評価基準で世界最高水準の成果を出すだけでなく、実際の開発現場においても複雑なタスクを安定してこなすための強固な基盤となっています。
JAPAN AI Codeの3つの強み:開発現場にもたらすメリット
JAPAN AI Codeは、その高度な技術基盤によって、実際の開発現場に以下のような多大なメリットをもたらします。
(1) 組織のコンテキストを理解する
JAPAN AI Codeは、JAPAN AI STUDIOと統合されているため、単なる外部ツールではありません。プロジェクトのドキュメント、これまでの会話履歴、社内のナレッジベースといった、組織が持つ固有の情報にアクセスしながら作業を進めることができます。これにより、JAPAN AI Codeは、まるでチームの一員であるかのように組織の文脈を深く理解し、その状況に合わせた最適な開発支援を提供します。
(2) エンジニアリングの民主化
JAPAN AI Codeは、専門のエンジニアだけが使うツールではありません。JAPAN AIのユーザーであれば、エンジニアリングの知識がない人でも、自然言語(普段使う言葉)で指示を出すだけで、業務の自動化、ファイルの操作、簡易的なアプリケーションの作成などを行うことができます。これにより、技術部門と非技術部門の間の壁を取り払い、「コスト効率の高いエンジニアリングリソース」として、組織全体の生産性向上に貢献します。
(3) コストと品質のバランスを柔軟に選択
複数のAIモデルに対応しているJAPAN AI Codeは、タスクの重要度や予算に応じて最適なAIモデルを選択できる柔軟性を提供します。例えば、高い精度が求められる本番環境のコード修正には高性能なClaude Opus 4.5を、日常的な調査やコードレビューにはコスト効率の良いモデルを使い分けることで、品質とコストの最適なバランスを実現し、開発コストの最適化を支援します。
JAPAN AI Codeの具体的な活用例:エンジニアと非エンジニアの業務を効率化
JAPAN AI Codeは、その多機能性により、エンジニアだけでなく、非エンジニアの業務にも革新的な変化をもたらします。
エンジニア向けの活用例
-
レガシーコードの解析とモダナイゼーション
ドキュメントが不足している古いコードベースの仕様をAIが解析し、現代的な構成へのリファクタリング案を提示します。これにより、ブラックボックス化していたシステムの保守コストを大幅に削減できます。 -
テストコードの自動生成と品質強化
既存のコードを分析し、エッジケース(特殊な状況)も考慮した単体テストや結合テストを自動生成します。開発者が新機能の実装に集中している間も、裏側でテストカバレッジ(テストでカバーされているコードの割合)を向上させ、ソフトウェア全体の品質を底上げします。 -
インシデントの一次対応・原因特定
システム障害発生時、大量のログやソースコードを横断的に分析し、「どのコミット(コード変更)が原因か」「どのデータベースクエリが遅延しているか」といった仮説を即座に提示します。これにより、障害復旧までの時間(MTTR: Mean Time To Recovery)を最小限に抑え、システムの安定稼働に貢献します。
非エンジニア向けの活用例
-
データ抽出・分析のセルフサービス化
「先月の売上データを地域別に集計したい」といった自然言語での依頼だけで、必要なSQL(データベース操作言語)を生成・実行し、結果をグラフ化します。エンジニアにデータ抽出を依頼して数日待つ必要がなくなり、ビジネスの意思決定を迅速化します。 -
業務効率化ツールの即時開発
日々の定型業務を自動化するスクリプトや、社内用の簡易管理画面をその場で作成します。アイデアを思いついたその日のうちに、実際に動作するツールとして手に入れることができ、業務の効率を飛躍的に向上させます。 -
「作りたい」を技術仕様へ変換
漠然としたビジネス要件(例:「顧客がもっと簡単に商品を見つけられるようにしたい」)をAIに投げかけると、それを実現するための具体的な機能仕様やデータ構造の案を提示します。これにより、開発チームに相談する前に「要件の解像度」を高め、開発工程での手戻りを防ぎます。
さらに、JAPAN AIが提供するノーコード開発環境「JAPAN AI STUDIO」と組み合わせることで、JAPAN AI Codeが生成したコードやアプリケーションをSTUDIOのページとして直接公開し、業務で即座に活用することも可能です。
今後の展望:よりシームレスな開発環境へ
JAPAN AIは、JAPAN AI Codeの進化を今後も継続的に推進していくと述べています。
エージェント基盤のさらなる改良に加え、開発者向けターミナルCLI(コマンドラインインターフェース)ツールの提供が計画されています。これにより、エンジニアが日常的に使用するターミナル環境から直接JAPAN AI Codeを利用できるようになります。JAPAN AI STUDIOとのシームレスな連携により、ローカルでのコード編集からJAPAN AI STUDIOでのページとしての公開まで、一気通貫の開発体験が実現されるでしょう。エンタープライズのお客様のセキュリティ要件やワークフローに最適化されたAIコーディング環境を目指していくとのことです。
また、世界水準の技術力を維持・向上させるため、同じビジョンを共有する優秀な技術者の採用を積極的に進めています。AIエージェント技術の最前線で、日本発の技術革新を共に推進していく仲間を募集しており、採用情報はこちらで確認できます。
JAPAN AI株式会社について
JAPAN AI株式会社は、「AIで持続可能な未来の社会を創る」をビジョンに掲げ、AIに関連するプロダクトやサービス開発を行っています。多様な業界や産業のさらなる発展に貢献することを目指しています。
会社概要
-
社 名: JAPAN AI株式会社
-
代 表 者: 代表取締役社長 工藤 智昭
-
本 社: 東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階
-
設 立: 2023年4月
-
事業内容: 人工知能の研究開発、人工知能に関するコンサルティングサービス

