AI時代の集団意思決定を最適化!急激な環境変化に強い社会学習の仕組みを徹底解説
現代社会は、情報技術の進化やAIの急速な発展により、かつてないスピードで変化しています。数ヶ月前には最適だった選択が、今ではもう「時代遅れ」になっていることも珍しくありません。このような「急激に変化する不確実な環境」の中で、私たち人間やAIを含む集団が、どのようにして賢く、そして柔軟な意思決定をしていくべきか、そのメカニズムを解き明かす画期的な研究成果が発表されました。
明治学院大学、東京大学大学院人文社会系研究科、総合研究大学院大学の研究グループは、集団が急激な環境変化に柔軟に対応できるための認知・行動メカニズムを理論的に解明しました。この研究は、私たちが他者の行動を参考にするときの「社会学習」の仕組みに注目し、異なる2つの学習タイプが共存することで、効率的かつ柔軟な意思決定が実現できることを示しています。この知見は、人間とAIが協力して社会を形成するこれからの時代において、多様性を活かしたより良い意思決定をデザインするための重要な手がかりとなるでしょう。
社会学習とは何か? AI初心者に優しい解説
私たちは日常生活の中で、無意識のうちに他者の行動や意見から多くのことを学んでいます。例えば、人気のあるレストランに並んでみる、友人がおすすめする商品を買ってみる、SNSで多くの人が「いいね」している投稿を信じてみる、といった行動はすべて「社会学習」の一例です。
「社会学習」とは、自分以外の他の個体から学習する現象のことで、人間だけでなく、アリやミツバチなどの動物にも広く見られます。アリがフェロモンを使って食料源を伝えたり、ミツバチが「8の字ダンス」で蜜の場所を教えたりするのも、社会学習の一種です。
この社会学習は、集団としてより良い意思決定を行うための重要な要素です。他者の経験や知識を共有することで、個々がゼロから試行錯誤するよりもはるかに効率的に、より良い選択肢を見つけ出すことができます。しかし、一方で、社会的な影響が強すぎると、環境の変化に対応できず、「集合愚(しゅうごうぐ)」と呼ばれる、集団全体として誤った選択をしてしまう可能性も秘めています。
なぜ社会学習のメカニズム解明が重要なのか?
現代社会では、インターネットやSNSを通じて瞬時に情報が拡散し、人々の行動や意見が爆発的に影響し合います。このような情報過多の環境では、ある情報が正しいと信じ込まれやすくなったり、特定の意見に同調しやすくなったりすることがあります。しかし、その情報が誤っていたり、環境が変化して以前の選択が最適でなくなったりした場合、集団全体が誤った方向へ進んでしまうリスクがあります。
本研究は、このような現代の情報空間において、集団が「意思決定の効率性(良い選択肢に素早く集中すること)」と「柔軟性(選択肢の時間的な変化に適切に対応すること)」という、両立が難しい2つの目標をどのように達成できるのかを理論的に明らかにしようとしています。このメカニズムを理解することは、誤情報の拡散や同調圧力による問題を防ぎ、より賢明な社会的意思決定を築くための基礎となります。
2つの社会学習アルゴリズム:価値形成(VS)と決定バイアス(DB)を徹底解説
これまでの認知神経科学の研究では、人々が他者から学ぶ社会学習の仕組みを、コンピューターが学習する「強化学習(注1)」という枠組みを使って数理的にモデル化する試みがされてきました。特に注目されているのが、以下の2つの対照的なアルゴリズム(仕組み)です。
1. 価値形成(Value Shaping; VS)型
VS型は、他者の行動を「擬似的な報酬」として利用し、選択肢の価値そのものを評価する仕組みです。簡単に言うと、「多くの人が選んでいるものは、きっと良いものに違いない」と判断し、その選択肢の価値を高く評価します。
具体例:人気のレストラン
あなたが新しいレストランを探しているとします。VS型の人であれば、行列ができている人気のレストランを見かけると、「多くの人が選んでいるのだから、きっと美味しいに違いない」と判断し、そのレストランの料理の価値そのものを高く評価します。そして、自分もそのレストランを選び、料理を「美味しい」と感じやすくなります。他者の選択が、自分の価値観に直接影響を与えるイメージです。
2. 決定バイアス(Decision Biasing; DB)型
DB型は、他者と同じ選択を「しやすくなる」一方で、選択肢の価値そのものは、自分の実際の経験に基づいて評価する仕組みです。つまり、「多くの人が選んでいるから、とりあえず自分も選んでみよう」とは思うものの、その選択肢の良し悪しは、あくまで自分の経験で判断します。
具体例:人気のレストラン
DB型の人も、行列のできている人気のレストランを見れば、「多くの人が選んでいるから、自分も行ってみよう」と、そのレストランを選ぶ可能性が高まります。しかし、実際に料理を食べてみて「美味しい」と感じるかどうかは、あくまで自分の味覚や経験に基づいて判断します。他者の行動によって自分の選択が影響されることはあっても、その選択肢に対する「価値」の評価は、他者に左右されず独立している、という違いがあります。

図1は、これら2つの社会学習アルゴリズムの違いを視覚的に示しています。VS型では他者の行動が選択肢に対する価値評価に直接影響するのに対し、DB型では価値評価はあくまで自己の報酬経験に基づきます。
環境変化への対応力:VS型とDB型のメリット・デメリット
研究グループは、これらの2つのアルゴリズムに従うエージェント(行為者)からなる集団が、さまざまな環境でどのように意思決定を行うかを「エージェントベースシミュレーション(注2)」という手法で調べました。このシミュレーションでは、多数派に同調する傾向の強さや、情報の共有方法、集団のサイズなどを変えて、それぞれの集団のパフォーマンスを比較しています。
安定した環境でのパフォーマンス
シミュレーションの結果、VS型の社会学習を行う人々からなる集団は、環境が安定している状況では、優れた選択肢に非常に迅速に収束できることが明らかになりました。多くの人が同じように「良い」と評価する選択肢に、集団全体が素早く集中できるため、効率的な意思決定が可能です。これは、流行に敏感に反応し、人気の商品やサービスに一斉に飛びつくような状況を想像すると分かりやすいでしょう。
急激な環境変化への対応力
しかし、VS型集団は、急激な環境変動が起きる状況では、その「効率性」が裏目に出ることが示されました。一度「良い」と評価された選択肢に固執しやすく、環境が変わってその選択肢がもはや最適でなくなっても、「時代遅れの選択」にいつまでも囚われてしまう傾向があるのです。これは、SNSで一度拡散された誤情報が、たとえ訂正されても信じられ続けてしまう現象や、過去の成功体験に縛られて新しい変化に対応できない企業のような状況と似ています。
一方、DB型の社会学習を行う人々からなる集団は、安定した環境での効率性はVS型に劣るものの、急激な変動に対しても非常に柔軟に対応できることが分かりました。DB型は、他者の行動に影響されつつも、価値評価は自分の経験に基づいて独立して行うため、環境が変われば、過去の経験にとらわれずに新しい選択肢を評価し、行動を変えることができるのです。

図2は、報酬確率が途中で逆転する(つまり、最適な選択肢が変わる)動的な環境でのシミュレーション結果です。グラフの右側を見ると、DB型のエージェントは環境の変化に対応して後半で最適な選択肢を選び直しているのに対し、VS型のエージェントは前半で最適だった選択肢に固執し、パフォーマンスを大きく低下させている様子が分かります。特に、多数派からの社会的影響が強い状況では、VS型集団の脆弱性が顕著になることが示されました。これは、現代のネット空間のような大規模な相互作用場面において、多くの人々が意識せず採用しているVS型の社会学習の仕方が、急激な変化に対しては危険をはらんでいる可能性を示唆しています。
多様性が生み出す「集合知」:VS型とDB型の共存がもたらす効果
この研究の最も重要な発見の一つは、VS型とDB型という質的に異なる2つの学習タイプが、集団の中で安定して共存できること(「進化的安定性」)を示した点です。さらに、単独では環境変動に弱いVS型のエージェントが、より柔軟なDB型のエージェントと組み合わされることで、集団全体としての意思決定パフォーマンスがいっそう改善されることが明らかになりました。
互いの短所を補い合う多様な集団
集団内にVS型とDB型のエージェントが適切な割合で混在することで、VS型の「効率性」とDB型の「柔軟性」という、それぞれの長所を活かし、短所を補い合うことができます。例えば、VS型のエージェントが安定した環境で素早く良い選択肢を見つけ出し、集団全体を効率的に導く一方、DB型のエージェントは常に自分の経験に基づいて価値を評価し続けるため、環境が変化した際にその変化をいち早く察知し、集団に新しい方向性を示すことができます。
この「多様性」が集団レベルで高いパフォーマンスを実現することは、「集合知(Collective Intelligence)」の重要性を示唆しています。異なる特性を持つ個体が協力し合うことで、個々の能力の合計以上の力を発揮できるという考え方です。例えば、企業で新しいプロジェクトを進める際、保守的で堅実な意見(VS型に近い)と、革新的で変化を恐れない意見(DB型に近い)が両方存在することで、リスクを管理しつつ、新しいチャンスを掴むことができる、といった状況に例えられるでしょう。

図3は、DB型、VS型、そして他者から学ばないRW型(ランダムウォーカー型)という3つのタイプが混在する集団の「進化ダイナミクス(注3)」を可視化したものです。この図では、相対的にパフォーマンスが高かったタイプが、集団内で数を増やしていくプロセスが示されています。その結果、DB型とVS型が安定して共存する状態が出現することが明らかになりました。これは、両者が適切な比率で混在している場合に、互いの弱点を補い合うことで集団レベルで高いパフォーマンスが実現しうることを示しています。
本研究が示唆するもの:人間とAIが共存する未来の社会デザイン
本研究で得られた知見は、個々のアルゴリズムの違いが集団全体に異なる結果をもたらすメカニズムや、集団内に多様性が維持される理由を理論的に明らかにしたものです。これは、人間とAIが協力し合うこれからの情報空間において、より良い集団的意思決定をどのようにデザインできるかという、喫緊の課題に対して重要な応用可能性を秘めています。
AI時代における社会的意思決定の課題と解決策
AIが社会のあらゆる側面に深く関わるようになり、私たちの意思決定プロセスも大きく変化しています。例えば、AIが推奨する情報や選択肢は、時に私たちの行動を強く誘導する可能性があります。もしAIがVS型のようなアルゴリズムに偏っていた場合、急激な環境変化に対して集団全体が対応できなくなるリスクも考えられます。
本研究の成果は、このようなAI時代の課題に対して、以下のような具体的な示唆を与えてくれるでしょう。
-
多様なAIアルゴリズムの設計: AIシステムを開発する際に、単一の効率性だけを追求するのではなく、VS型とDB型のような異なる特性を持つアルゴリズムを組み合わせることで、より頑健で柔軟な意思決定を可能にするAIを設計できるかもしれません。
-
人間とAIの最適な協調: 人間とAIが協力して意思決定を行う場合、人間がDB型の柔軟性を担い、AIがVS型の効率性を担う、あるいはその逆の役割分担をすることで、集団全体のパフォーマンスを最大化できる可能性があります。どのような組み合わせが最適なのか、さらなる研究が期待されます。
-
社会問題への応用: 災害やパンデミックのような不確実な状況下で起こりやすい、同調圧力の過剰な高まり、誤情報の拡散、陰謀論の普及といった社会問題に対して、本研究の知見は社会工学的なアプローチを考える上での重要な基礎となります。例えば、情報共有の仕組みを工夫したり、多様な意見が共存しやすいプラットフォームを設計したりすることで、集合愚を防ぎ、より良い社会的な合意形成を促せるかもしれません。
この研究は、個体レベルの計算プロセスが集団レベルの動態を規定するという新しい視点を提供し、人間とAIが共存する情報空間で、いかにして優れた集合的意思決定をデザインしていくかという問いに対する重要な一歩となるでしょう。
研究の背景と研究者たち
この画期的な研究は、東京大学大学院人文社会系研究科社会文化研究専攻の菅沼秀蔵 大学院生、産業技術総合研究所・人間情報インタラクション研究部門の片平健太郎研究グループ長、総合研究大学院大学・統合進化科学研究センターの大槻久教授、そして明治学院大学情報数理学部・情報科学融合領域センターの亀田達也教授(責任著者)らの研究グループによって行われました。
本研究成果は、2025年11月24日に、世界的に権威のある科学誌である米国科学アカデミー紀要(Proceedings of the National Academy of Sciences of the United States of America)にて公開されました。
論文情報
-
雑誌名: Proceedings of the National Academy of Sciences of the United States of America
-
題名: How social learning enhances-or undermines-efficiency and flexibility in collective decision-making under uncertainty
-
著者名: Hidezo Suganuma, Kentaro Katahira, Hisashi Ohtsuki, and Tatsuya Kameda (責任著者)
-
DOI: 10.1073/pnas.2516827122
この研究は、「JST次世代研究者挑戦的研究プログラム(課題番号:JPMJSP2108)」、「科研費基盤研究(A)(課題番号:JP23H00074)」、「科研費基盤研究(C)(課題番号:JP24K15121)」の支援を受けて実施されました。
まとめ
現代社会における急速な環境変化の中で、集団がどのようにして効率的かつ柔軟な意思決定を行うかという問いは、人間社会だけでなく、AIがますます影響力を持つこれからの時代において、極めて重要です。本研究は、社会学習のメカニズムを深く掘り下げ、異なる特性を持つ2つの学習アルゴリズム(価値形成型と決定バイアス型)が共存することで、その両立が可能になることを理論的に示しました。
この成果は、単に学術的な発見にとどまらず、私たちが直面する様々な社会問題への対処や、人間とAIがより良い形で共存する未来の情報空間をデザインするための具体的な指針を与えてくれるものです。多様性を尊重し、異なる視点や学習スタイルを組み合わせることが、不確実な時代を生き抜くための鍵となるでしょう。
用語解説
(注1)強化学習(reinforcement learning)
エージェント(行動する主体)が、環境から得られる「報酬」を最大化するように行動を学習する、機械学習の手法の一つです。心理学や行動科学で人間や動物の知性を理解する基礎理論として使われるほか、近年ではロボットの制御や、ChatGPTのような大規模言語モデルをはじめとする人工知能(AI)の開発にも幅広く応用されています。
(注2)エージェントベースシミュレーション(agent-based simulation)
個々の主体(エージェント)が、比較的シンプルな学習や行動のルールに従って動く様子をコンピューター上で再現し、それらのエージェントが集まることで集団全体がどのような振る舞いをするのかを調べる研究手法です。複雑な社会現象や経済現象を分析するのに用いられます。
(注3)進化ダイナミクス(evolutionary dynamics)
ここでは、集団内で、ある行動様式(社会学習アルゴリズムのタイプ)が他の行動様式よりも高いパフォーマンスを示した場合に、その行動様式が時間とともに集団内で数を増やしていくプロセスのことを指します。生物の進化をモデル化する際にも使われる概念です。

