AIが科学研究を変える!「AI for Science」プロジェクトとは?
現代の科学研究は、日々生み出される膨大な量のデータとの戦いです。特に、グラフや図表、自由記述といった「非構造化情報」と呼ばれる形式のデータは、コンピューターが直接理解しにくく、研究者が手作業で解析するには限界があります。このような状況が、新しい発見につながる重要な知見を見落とす原因となったり、研究成果の分析や共有の効率を妨げたりしています。結果として、日本における産業的なイノベーションの機会損失にもつながる可能性が指摘されています。
こうした課題に対し、東京大学、カラクリ株式会社、そして株式会社Upstageの3者が手を組み、AIを活用した科学研究支援プロジェクト「AI for Science」を2025年11月10日に始動しました。このプロジェクトの目的は、生成AIの力を借りて、科学的発見のプロセスそのものを大きく変革することにあります。具体的には、データ解析をこれまで以上に速く、そして正確に行い、AIが高度な推論を導き出し、研究者が知識を効率的に探索できるような環境を築き上げることを目指しています。
日本はこれまで、物理学、材料科学、医学など、多くの科学分野で世界をリードしてきました。「AI for Science」は、この科学技術立国としての日本の伝統を、AIが中心となる新しい時代へと継承し、さらに発展させていくための重要な一歩となるでしょう。AIの力を最大限に活用することで、日本がデータ駆動型の知的発見の最前線に立ち続けられるよう、プロジェクトは推進されていきます。

日本の科学研究を加速する3社の連携と「Syn Pro」の力
「AI for Science」プロジェクトは、東京大学の理論的知見、カラクリ株式会社のAI実装技術、そしてUpstageの先進的な大規模言語モデル(LLM)と文書解析技術という、それぞれの強みを融合させることで推進されます。この強力な連携により、現在の科学研究が抱える複雑な課題の解決に挑みます。
プロジェクトを支える各社の役割
-
Upstage: 大規模言語モデル(LLM)とDocument Parse技術を活用し、研究データから高度な情報を抽出し、その特徴を詳細に解析する役割を担います。
-
LLM(大規模言語モデル) とは、大量のテキストデータを学習することで、人間のような自然な文章を生成したり、質問に答えたり、情報を要約したりできるAIのことです。まるで人間が書いたかのような自然な文章を生成できるため、「生成AI」とも呼ばれます。
-
Document Parse技術 は、論文やレポートなどに含まれるテキストだけでなく、グラフ、図表、画像といった「非構造化情報」をAIが理解できる形に変換する技術です。これにより、これまでAIが「見ることができなかった」情報をAIが扱えるようになり、より深い分析が可能になります。Upstageのこの技術は、複雑な研究データの中から価値ある知見を見つけ出す上で重要な役割を果たします。
-
-
東京大学 岡田 真人教授: 科学研究における理論的な知見を提供し、プロジェクト全体の研究リーダーシップを発揮します。学術的な視点からAIの活用方法を深く探求し、研究の方向性を決定する上で中心的な役割を担います。
-
カラクリ株式会社: AI実装およびエンジニアリング技術を駆使し、プロジェクトで開発されたAIソリューションを実際に利用可能なシステムとして提供する役割を担います。AIモデルを研究現場で機能させるための具体的なシステム構築や運用において、その専門性を発揮します。
基盤となる高性能日本語LLM「Syn Pro」
本プロジェクトでは、Upstageとカラクリが共同開発した日本発の大規模言語モデル「Syn Pro」が基盤モデルとして活用されます。「Syn Pro」は、その日本語性能において国内開発モデルとして第1位を獲得し、さらにWeights & Biasesが運営するNejumi Leaderboardでは世界トップ20入りを果たすという、非常に高性能な日本語LLMです。
この「Syn Pro」の活用は、日本の研究者が安心して利用できる「安心・安全な環境」と、「高いコスト効率性」のもとで科学研究のデータ解析と知識構造化を実現するための新しい基盤を築きます。高性能な日本語LLMが研究現場に導入されることで、言語の壁を越え、日本の研究者がより効率的に、そして深く科学的探求を進めることが可能になるでしょう。
科学とAIの新たなフロンティア:データ駆動型研究への変革
現代の科学研究では、データが急速に増大し、その種類も多様化しています。この膨大な情報の中から、本当に価値のある知見を見つけ出すことは、ますます難しくなっています。特に、現在の多くのシステムは、グラフや図表といった「非構造化情報」を直接「見る」ことができません。これにより、データの品質評価が難しくなり、研究成果の分析、検証、共有の効率が大きく妨げられていました。この非効率性は、日本における産業的なイノベーションの機会損失にもつながると考えられています。
「AI for Science」プロジェクトは、この根本的な課題の解決を目指しています。3者が連携し、AIによる高度な情報抽出と特徴解析、そしてAI実装・エンジニアリング技術を組み合わせることで、以下の変革を実現しようとしています。
-
自動化: AIがデータの収集、整理、初期分析といった作業を自動で行うことで、研究者はより創造的な思考や実験に時間を割けるようになります。
-
透明性: AIによる解析プロセスや推論の根拠が明確に示されることで、研究の信頼性と再現性が向上します。
-
協働性: AIが研究者の強力なアシスタントとして機能し、人間とAIが協力して新たな発見を追求する研究モデルを確立します。
このプロジェクトの成果については、将来的な知的財産権の確保に向けて、現在検討が進められています。
プロジェクトに込められた熱意:関係者コメントから読み解く未来
「AI for Science」プロジェクトの始動にあたり、関係者からは日本の科学研究の未来に対する強い期待と熱意が語られています。それぞれのコメントから、プロジェクトが目指すビジョンと、AIがもたらす変革の可能性を深く掘り下げてみましょう。
東京大学 岡田 真人教授のコメント
岡田教授は、AIが科学を変革する大きな力を持つ一方で、その前提となる「データの構造化」の重要性がこれまで十分に認識されてこなかったと指摘しています。AIがデータを効率的に利用するためには、データがAIにとって理解しやすい形に整理されている必要があります。これを「AI-Readyなデータ基盤」と呼びます。教授は、UpstageのDocument AI技術に加え、カラクリと共同開発したLLM「Syn Pro」が社会に広く実装されることで、研究機関や民間企業が長年抱えてきた本質的な課題が解決される可能性に強い期待を寄せています。
さらに、岡田教授は、この三者連携によるAIの取り組みが、ヘルスケアや製造業といった幅広い産業領域においても真の価値を発揮できる環境を築くことが自身の使命だと語っています。AI for Scienceの活用がまだ始まったばかりの今だからこそ、この分野をリードする新たな世界を共に切り拓いていきたいという強い意気込みが感じられます。
カラクリ株式会社 取締役 Chief Product Officer 中山 智文氏のコメント
中山氏は、東京大学の岡田教授、そしてUpstage社と共に「AI for Science」を始動できたことに心からの喜びと「ワクワク」を表明しています。カラクリのR&Dチームには、中山氏を含め岡田研究室出身のメンバーが多く在籍しており、このプロジェクトが彼らにとって「原点回帰」とも言える特別な意味を持つことがうかがえます。
また、Upstage社とは強力なタッグを組み、国内トップクラスの日本語モデル「Syn Pro」の開発を進めてきた経緯に触れ、このプロジェクトがこれまでの努力と経験が結びつくことで、科学の未来に挑戦する研究者を力強く支援していきたいという強い意志を示しています。
Upstage AI株式会社 代表取締役 松下紘之氏のコメント
松下氏は、カラクリ株式会社および東京大学とは、プロジェクトのキックオフ以来、約半年にわたり科学研究の現場におけるAI活用の可能性を共に探ってきたことに触れ、今回「AI for Science」の社会実装に向けて大きな一歩を踏み出せることを大変喜んでいます。Upstageは、グローバル市場で培ってきた「Document Intelligence技術」を軸に、非構造データをAIが理解できる形へと変換し、研究や業務における知識活用を支援してきました。
さらに、今年10月にはカラクリとの共同開発により、国内開発モデルとして最高水準の日本語性能を誇るLLM「SynPro」をリリースしたことを強調しています。この「SynPro」が、「安心・安全な環境」と「高いコスト効率性」のもとで科学研究のデータ解析と知識構造化を実現する新たな基盤を整えたと述べています。松下氏は、このプロジェクトチームが一体となって新たなシナジーを生み出すことで、AIが日本の科学研究、そしてその先の産業発展の可能性を大きく切り拓いていく未来を見据え、現場での価値創造を共に実現していきたいというビジョンを語っています。
AIが「研究パートナー」となる未来:期待される成果と今後の展望
「AI for Science」プロジェクトは、AIを単なる計算ツールとしてではなく、研究者の思考や推論を支援する「科学的パートナー」として位置づける、まったく新しいアプローチを提示しています。このプロジェクトを通じて、AIは研究者の強力な味方となり、これまで以上に効率的かつ深い科学的探求を可能にするでしょう。
本プロジェクトでは、AIを活用することで、研究の再現性と説明性を高めることを目指しています。研究の再現性とは、他の研究者が同じ条件で実験や分析を行った際に、同じ結果が得られることを指します。また、説明性とは、AIが導き出した結論や予測について、その根拠や理由を人間が理解できる形で説明できることを意味します。これらが向上することで、科学的知見の信頼性が高まり、新たな知見の創出が加速されることが期待されます。
今後の具体的な予定として、2026年にはプロジェクトのプロトタイプが構築され、共同研究成果が発表される見込みです。これは、AIが科学研究の現場でどのように機能し、どのような価値を生み出すのかを示す重要なマイルストーンとなるでしょう。さらに、プロジェクトは学術分野に留まらず、産業界との連携も視野に入れています。AIが科学の現場で実際に機能し、社会全体に貢献できるようなエコシステム(生態系)の確立を目指していくとのことです。
Upstageについて:グローバルAIスタートアップが牽引する日本のAI変革
Upstageは、安全性と高性能を兼ね備えた生成AIソリューションを提供するグローバルAIスタートアップです。AmazonやAMDといった大手企業からも出資を受けており、その技術力と将来性が高く評価されています。特に、日本語に特化した次世代の大規模言語モデル(LLM)を新たにリリースし、日本の文脈に即した高精度で信頼性の高いAIソリューションを提供しています。
UpstageのAI技術は、保険、法律、医療といった厳格な規制が求められる産業分野のリーダー企業でもすでに活用されています。これらの分野では、複雑で非構造的な文書(契約書、医療記録、法律文書など)が大量に存在しますが、UpstageのAIはこれらの文書から必要な情報を抽出し、実用的なビジネス価値へと変換することで、業務の効率化と高度化に貢献しています。
Upstageは、AIが日本の社会や産業に深く根付き、新たな価値を創造していくための重要な役割を担っています。
- Upstage AI株式会社 公式サイト: https://www.upstage.ai/jp

まとめ:日本の科学研究の未来を拓く「AI for Science」
東京大学、カラクリ株式会社、株式会社Upstageが共同で始動した「AI for Science」プロジェクトは、日本の科学研究に新たな変革をもたらす画期的な取り組みです。
このプロジェクトは、生成AI、特に高性能な日本語LLM「Syn Pro」と先進的なDocument Parse技術を駆使することで、これまで人間が手作業で行っていたデータ解析や知識探索のプロセスを劇的に効率化し、研究者がより本質的な思考や創造的な活動に集中できる環境を整えます。非構造化データの壁を乗り越え、データ駆動型の知的発見を加速させることで、日本の科学技術は次のステージへと進むことでしょう。
関係者からの熱いコメントからも分かるように、本プロジェクトは単なる技術導入に留まらず、AIを研究者の真の「科学的パートナー」として位置づけ、研究の再現性や説明性を高め、新たな知見の創出を加速させることを目指しています。2026年にはプロトタイプの発表が予定されており、その成果が学術界だけでなく、ヘルスケアや製造業といった幅広い産業界に波及し、日本のイノベーションを大きく推進する可能性を秘めています。
「AI for Science」は、AIが日本の科学研究、ひいては産業全体の発展に貢献し、日本が世界をリードし続けるための重要な一歩となるでしょう。このプロジェクトが描くAIと科学の協働による未来に、大きな期待が寄せられます。

