電通総研、東北大学、Studio OusiaがAI最高峰「NeurIPS 2025」で優勝!オープンソースDeep Researchの未来を拓く

AI分野最高峰の国際会議「NeurIPS 2025」で日本勢が快挙!電通総研・東北大学・Studio Ousiaがオープンソース技術で優勝

人工知能(AI)の進化は目覚ましく、私たちの生活やビジネスに大きな変化をもたらしています。そんなAI分野で世界最高峰と称される国際会議「NeurIPS(ニューリプス) 2025」のコンペティションにおいて、日本から素晴らしいニュースが届きました。

株式会社電通総研、国立大学法人東北大学 言語AI研究センター、そして株式会社Studio Ousiaの3者が共同で参加し、オープンソース技術部門で優勝という栄誉に輝いたのです。特に、高度な長文質問応答システム「Deep Research」の構築で高い評価を獲得しました。この快挙は、今後のAI研究と実用化において重要な一歩となるでしょう。

電通総研、東北大学 言語AI研究センター、Studio Ousiaのロゴ

NeurIPS 2025とは?AI分野の最高峰会議を分かりやすく解説

「NeurIPS」は、「Neural Information Processing Systems」の略で、機械学習、深層学習、強化学習、学習理論といったAIの核心分野における世界で最も規模が大きく、権威ある国際会議の一つです。毎年世界中のトップ研究者やエンジニアが集まり、最新の研究成果を発表し、議論を交わします。

この会議で開催されるコンペティションは、特定の技術課題に対して、参加チームがその解決策の性能を競い合う場です。今回のコンペティション「MMU-RAG(Massive Multi-Modal User-Centric Retrieval-Augmented Generation)」では、特に「Deep Research」と呼ばれる、長文形式の質問応答を高精度かつ効率的に処理するシステムの性能が問われました。

Deep Researchとは?ChatGPTやGeminiにも搭載される高度なリサーチ機能

Deep Researchとは、ChatGPTやGoogleのGeminiといった生成AIに搭載されている、非常に高度な情報探索、要約、そして回答生成までを自律的に行うリサーチ機能を指します。まるで専門家が時間をかけて調査レポートを作成するような作業を、AIが自動で行ってくれるイメージです。

しかし、これらの高度な機能は、通常、商用サービスとして提供されるクローズドな技術であり、その内部の仕組みや詳細な動作は一般には公開されていません。そのため、学術研究やオープンな検証目的で直接利用することは難しいのが現状です。

こうした背景から、アカデミア(大学や研究機関)では、オープンソース技術(誰もが自由に利用・改変できる技術)を用いて、これらの高度なリサーチ機能を再現し、さらに発展させるための研究が活発に進められています。

コンペティション「MMU-RAG」の課題:長文質問応答の難しさ

従来のAI研究の多くは、短い文章の質問に対する応答に焦点を当ててきました。これは、短い文章であればAIの出力と正しい答えを比較しやすく、AIを効率的に学習させることが比較的容易だからです。

しかし、「MMU-RAG」コンペティションの最大の課題は、長文形式の質問応答でした。長文の回答をAIが生成した場合、それがどれだけ正確で適切かを自動で評価することは非常に難しいとされています。このため、今回のコンペティションでは、長文回答を自動で評価する仕組みを設計すること、そしてその評価を効率的なAI訓練に活用する手法が重要なテーマとなりました。この課題をオープンソース技術で解決した点が、今回の優勝の大きな要因です。

Deep Research技術の仕組みと社会での活用例

Deep Researchシステムは、大規模言語モデル(LLM)と呼ばれる生成AIを核として、さまざまな「ツール」と呼ばれる機能を組み合わせた、高度な情報検索・分析システムです。ユーザーの質問に対して、専門家による調査レポートに匹敵するような、精緻な回答を自動で生成できるため、以下のような多様な用途での活用が期待されています。

  • 市場調査や競合分析: 特定の市場の動向や競合他社の戦略を効率的に調査。

  • 学術論文のサーベイや最新動向の把握: 大量の論文から必要な情報を抽出し、研究の全体像や最新トレンドを把握。

  • マーケティングリサーチ: 消費者のニーズや行動パターンに関する情報を収集・分析。

  • 金融データや経済指標の分析: 膨大な金融情報から意味のある洞察を導き出す。

従来のキーワード検索とは異なる、Deep Researchの4つの特徴

Deep Researchの高度な調査能力は、従来の単なるキーワード検索とは一線を画します。主に以下の4つの特徴が挙げられます。

  1. 検索意図の深い理解と調査計画の自動立案: ユーザーが入力した質問文を単なるキーワードとして扱うのではなく、その質問の背後にある意図や目的を深く推測します。そして、その目的を達成するために、どのような情報を、どのような手順で調査すべきかという計画をAIが自動的に立てます。
  2. 広範な情報源からの自動収集: 立てられた計画に基づき、AIは自身の内部に持つ知識だけでなく、インターネット上の多様な情報源(ウェブサイト、ニュース記事、専門データベースなど)から、必要な情報を段階的かつ網羅的に収集します。
  3. 情報の信頼性評価と出典の提示: 収集した情報が本当に信頼できるものか、矛盾がないかといった複数の視点から評価を行います。さらに、回答に利用した情報の出典(どこからその情報を得たか)を明確に示し、情報の透明性と信頼性を高めます。
  4. 多角的な分析と高品質な洞察の生成: 単に情報を集めて要約するだけでなく、集めた情報同士の関連性や整合性を検証しながら、多角的な視点から分析を行います。これにより、表面的な情報にとどまらない、質の高い深い洞察(インサイト)を提供することが可能になります。

なぜオープンソース技術でのDeep Research構築が重要なのか?

電通総研は、自社のソリューション(顧客向けサービス)において生成AIの活用を進めており、Deep Researchはその中でも特に重要な機能の一つとして位置づけています。これまで、知的で単純な作業の効率化を目指す研究開発では、主に商用サービスとして提供されるクローズドなDeep Research機能を利用してきました。

しかし、一般的なSaaS(Software as a Service)として提供されるDeep Research機能は、企業ごとの具体的な要件に合わせた細かいカスタマイズが難しいという課題や、利用コストの面でも考慮すべき点がありました。

そこで電通総研は、将来的にオープンソース技術を活用したDeep Research機能を自社で開発・運用することを現実的な選択肢とするため、東北大学と言語AI研究センター、そしてStudio Ousiaと連携し、最先端技術の調査や技術検証を継続的に行うことを目的に、今回のコンペティションに参加しました。

オープンソース技術は、その透明性と柔軟性から、特定のベンダーに依存せず、自社のニーズに合わせて自由に改変・発展させられるという大きなメリットがあります。今回の優勝は、このオープンソース技術が、高度なAIシステム構築において商用技術に匹敵、あるいはそれ以上の可能性を秘めていることを証明するものです。

優勝を勝ち取った技術的アプローチ

今回のコンペティションでの優勝は、各社の専門知識と連携の賜物です。特に、Studio Ousiaの山田氏が指揮を執り、以下の技術的アプローチが採用されました。

  • 大規模言語モデル「Qwen3-Next-80B-A3B」の活用: アリババクラウド社が提供するオープンソースの大規模言語モデル「Qwen3-Next-80B-A3B」を基盤として利用しました。

  • Direct Preference Optimization(DPO)による生成精度向上: スタンフォード大学が発表した「Direct Preference Optimization(DPO)」という強化学習手法を適用しました。これは、報酬関数の設計や報酬モデルの作成をせずに、モデルを直接最適化することで、長文回答の生成精度を効果的に高める技術です。

  • Key Point Recall(KPR)を用いた自動評価フレームワーク: 長文の生成文章において、その「事実性」を適切に評価することは非常に困難です。この課題に対し、Key Point Recall(KPR)という指標を導入し、生成された文章が正解の文章に含まれる重要な情報や単語をどれだけ含んでいるかを示すことで、自動評価のフレームワークを構築しました。

  • 高度な検索モジュールの組み込みとハイパーパラメータ調整: 文書を再ランク付けしたり、要約したりする高度な検索モジュールをシステムに組み込みました。さらに、これらのモジュールの動作を最適化するための「ハイパーパラメータ」を適切に調整することで、長文形式の質問応答を効率的に処理するシステムを実現しました。

これらの複合的な技術的工夫により、text-to-textトラックのオープンソース部門において最高スコアを記録し、優勝という輝かしい成果につながりました。

成果と将来的な応用:社会の様々な分野で活躍するDeep Research

今回の優勝によって得られた最大の成果は、オープンソース技術のみを用いて、Deep Researchシステムを設計、実装、そして評価するための実践的な知見と、再利用可能な優れたアーキテクチャ(システムの骨組み)を獲得したことです。この強固な基盤があれば、今後、様々な分野で長文質問応答を中心とした高度なリサーチ機能をシステムに組み込んでいくことが可能になります。

例えば、以下のような幅広いユースケースへの展開が期待されます。

  • 学術研究: 大量の研究論文から必要な情報を効率的に抽出し、新たな知見の発見を加速。

  • 企業内のナレッジ活用: 社内に蓄積された膨大な文書から、必要な情報を素早く見つけ出し、業務効率を向上。

  • 公共分野: 政策立案のための資料調査や、市民からの問い合わせ対応の高度化。

電通総研は、今回の成果を活かし、自社のソリューション群にこのDeep Research機能を段階的に組み込んでいく計画です。これにより、調査、企画、文書作成、問い合わせ対応といった知的業務の効率化と高度化を図ります。例えば、製造業における技術文書や過去の障害事例の横断検索、コンサルティングプロジェクトにおけるリサーチの自動化などが考えられます。

デジタルファイナンス分野での大きな可能性

特に重要な応用分野の一つが「デジタルファイナンス」です。近年、決済や融資といった金融機能が個別のサービスとして提供される「アンバンドル化」が進んでいます。このような状況でDeep Research技術を組み込むことで、規制やガイドライン、市場データ、企業開示情報など、多様な情報源を横断的に分析し、新たな金融サービスの企画、審査、そしてモニタリングを高度化することを目指します。

電通総研は、デジタルネイティブな発想に基づいたファイナンス機能群の提供を拡充し、金融を含む様々な産業領域における高度な意思決定を支えるプラットフォーム構築に貢献していくことでしょう。

関係者からのコメント

今回の快挙に対し、各社の担当者からコメントが寄せられています。

<株式会社電通総研 事業開発室 データサイエンティスト 尾崎 尚憲氏のコメント>

「NeurIPS 2025」のコンペティション「MMU-RAG」において、大きな注目を集めているDeep Researchアプローチを核としたシステムで優勝できたことを大変光栄に思います。多段階の情報探索と推論を組み合わせるだけでなく、リーズニングモデルのチューニングを行った今回のアプローチは、LLMの検索を人間に近づけることを目指した取り組みです。本コンペティションの参加にあたり、Studio Ousiaの山田氏、鈴木氏、東北大学の鈴木教授および研究室の皆様に、心より感謝申し上げます。今回の成果を出発点として、実用的な、本当に役立つDeep Researchシステムの実用化・高度化に、今後も継続して取り組んでいきます。

<東北大学 言語AI研究センター センター長 鈴木潤氏のコメント>

従来から日々利用しているWeb検索の発展形として期待され、今後の様々な調べ物において中心的な方式になる可能性を秘めたDeep Research方式に連なる技術を自分たちで独自に組み上げる貴重な機会となりました。今後の研究に有益な知見や経験を得ることができました。

<株式会社Studio Ousia チーフサイエンティスト 山田育矢氏のコメント>

最近、ChatGPTやGeminiなどに搭載されているLLMによる自律的なリサーチ機能であるDeep Researchは、主にクローズドな商用LLMを用いて実現されていますが、オープンな技術で同様の機能を実現することは難しい課題です。今回のコンペティションで開発したオープンで再現可能なDeep Researchが、その解決の一助となり、この分野の研究がさらに発展していくことを期待します。

協力組織について

今回の成果を支えた各組織の概要は以下の通りです。

  • 東北大学 言語AI研究センター
    自然言語処理分野で国内最大級の研究グループを擁し、生成AIを含む高度なAI技術の原理解明、AIアラインメントやセーフティ研究、AI基盤技術の発展を推進しています。AI駆動型研究の推進、AI人材育成、社会実装など幅広い領域でAI技術の発展に貢献することを目指しています。
    https://langai.tohoku.ac.jp/

  • 株式会社Studio Ousia
    「テキストを『使えるナレッジ』へ」をビジョンに掲げ、自然言語処理を活用して組織の情報資産から新たな付加価値を創出しています。ウェブ上の知識だけでなく、組織固有の知識も活用できる大規模言語モデル(LLM)の開発に強みを持っています。
    https://www.ousia.jp/

  • 株式会社電通総研
    「HUMANOLOGY for the future~人とテクノロジーで、その先をつくる。~」を企業ビジョンとし、「システムインテグレーション」「コンサルティング」「シンクタンク」の3つの機能連携により、社会全体の課題解決と進化を支援・実装しています。テクノロジーや業界の枠を超えた「X Innovation(クロスイノベーション)」を推進し、新たな価値を創造し続けています。
    https://www.dentsusoken.com

まとめ:オープンソースDeep Researchが拓くAIの未来

電通総研、東北大学 言語AI研究センター、Studio Ousiaの3者による「NeurIPS 2025」での優勝は、オープンソース技術を用いたDeep Researchシステムが、商用サービスに匹敵する、あるいはそれ以上の高度な情報探索・分析能力を持つことを世界に示しました。

この成果は、AI技術の民主化を促進し、企業や研究機関がより柔軟かつコスト効率良く、自社のニーズに合わせたAIシステムを構築できる可能性を広げます。特に、大量の情報を正確かつ深く理解し、質の高い洞察を導き出すDeep Researchは、ビジネスの意思決定、学術研究の加速、そして社会全体の課題解決において、今後ますます重要な役割を担っていくことでしょう。日本の研究チームが世界をリードするこの技術が、私たちの未来をどのように豊かにしていくのか、今後の展開に注目が集まります。

タイトルとURLをコピーしました