AI(人工知能)技術の進化は目覚ましく、私たちの生活やビジネスのあらゆる側面に影響を与えています。そして今、その波は科学研究の現場にも押し寄せ、「AI for Science」(科学のためのAI)という新たな領域が注目を集めています。
国産LLM(大規模言語モデル)の開発で知られるカラクリ株式会社は、この「AI for Science」領域への本格参入を発表しました。この重要な一歩として、同社は東京大学大学院新領域創成科学研究科の岡田眞人教授、そしてグローバルAIスタートアップであるUpstage AI株式会社と共同で、科学研究支援プロジェクトを始動しました。この連携は、AIを活用して科学研究のプロセスを根本から変革し、新たな発見を加速させることを目的としています。

AI for Scienceとは?科学研究にAIを導入する意義
「AI for Science」とは、その名の通り、科学研究のあらゆる段階でAI技術を応用し、研究の効率化、高度化、そして新たな発見の創出を目指す取り組みです。具体的には、データ解析、仮説生成、実験計画、シミュレーション、さらには論文作成支援といった多岐にわたるプロセスでAIが活用されます。
現在の科学研究は、その高度化が進む一方で、いくつかの課題に直面しています。これらの課題が、研究のスピードと再現性を阻害する要因となっている可能性があります。
1. データ活用の非効率性:研究者の時間を奪う複雑なデータ処理
現代の科学研究では、膨大な量のデータが日々生み出されています。しかし、これらのデータを分析し、次の研究に活かすためには、複雑な前処理や解析が必要です。例えば、数万件にも及ぶ過去の論文から関連情報を手動で探し出したり、複雑な実験データの統計解析に膨大な時間を費やしたりといった作業が、研究者の貴重な時間を奪っています。
このような非効率なデータ活用は、研究者が本来集中すべき「創造的思考」や「新たな仮説の構築」の妨げとなっています。AI for Scienceでは、AIがこれらのデータ解析や前処理を自動化・効率化することで、研究者はより本質的な研究活動に専念できるようになります。
2. 暗黙知の壁(属人化):知識の共有と活用を阻む課題
科学研究の現場では、長年の経験を持つ熟練の研究者が持つ「勘」や「コツ」といった、言葉では説明しにくい「暗黙知」が非常に重要です。しかし、この暗黙知は個々の研究者に属し、組織全体で構造化された資産として活用されにくいという課題があります。例えば、特定の実験における最適な条件設定がベテラン研究者の経験に依存したり、過去の失敗事例から得られた教訓が共有されず、新たな研究者が同じ過ちを繰り返す可能性もあります。
また、論文などの文献検索も、熟練者の経験や勘に依存するケースが多く見られます。このような「暗黙知の壁」は、組織全体の研究開発能力の向上を妨げ、研究成果の再現性にも影響を与える可能性があります。
カラクリは、まずデータやナレッジ活用の非効率性に取り組み、将来的にこの暗黙知の壁の打破を目指すことで、科学研究の根深い課題解決に貢献しようとしています。
カラクリ独自の強み:高性能LLMと現場起点のAI実装力
カラクリが「AI for Science」領域で優位性を持つのは、単にAI技術を持っているだけでなく、「高性能LLMの開発力」と「現場起点のAI実装力」という二つの強みを兼ね備えている点にあります。これらの強みが、科学研究の現場が抱える具体的な課題解決に直結します。
1. 高性能LLM活用による「暗黙知の組織資産化」
カラクリはこれまで、カスタマーサポート領域において、LLM(大規模言語モデル)を利用して複雑なナレッジ構造を解析・処理し、その精度を大幅に向上させてきた実績を持っています。この技術は、企業内の膨大な知識を整理・活用する「ナレッジマネジメント」に応用され、研究文書に埋もれる専門知識を正確に抽出し、誰もがアクセス・活用できる確かな基盤となります。
例えば、数千、数万ページの実験ノートや研究報告書の中から、特定の条件下での反応データや、失敗した実験から得られた貴重な知見をAIが素早く抽出し、関連付けて提示できるようになるでしょう。これにより、個人の暗黙知が組織の形式知へと変換され、研究者間の知識共有が促進されます。
2. AI実装による属人化の是正とデータ駆動型研究の実現
カラクリは、最適な実験条件の設定が熟練者の経験値に依存しがちだった研究組織に対し、AI解析ツールを構築し、属人化していた判断プロセスを是正した実績があります。この経験は、科学研究の現場において、実験の成功率を高め、開発スピードを加速させるための「データ駆動型研究プロセス」の構築に活かされます。
AIが過去の実験データや文献情報を分析し、最適な実験条件や次のステップを提案することで、研究者はより効率的かつ科学的な意思決定が可能になります。これにより、経験の浅い研究者でも高い精度で研究を進めることができ、研究成果の再現性も向上することが期待されます。
3. 独自LLM開発力:国産最高水準のモデルで用途に応じた開発が可能
カラクリは、経済産業省・NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)が推進する「GENIAC」に採択されており、国産LLMにおいてトップクラスの性能を誇るLLMシリーズ「KARKURI LM」を提供しています。さらに、国産初となる「CUA(Computer-Using Agent)」を開発するなど、高い技術力を持っています。この独自のLLM開発力により、科学研究の特定のニーズに合わせたカスタマイズされたモデルの開発も可能となり、より専門的で精度の高いAIソリューションを提供できます。
東京大学・Upstage社との共同プロジェクト:非テキスト情報の壁を越える
今回の共同プロジェクトは、カラクリの「AI for Science」本格展開における戦略的な第一歩です。生成AIを活用し、科学的発見のプロセスを根本から変革することを目的としています。
プロジェクトの背景:研究の加速を阻む「非テキスト情報」の課題
近年、科学研究におけるデータは急速に増大し、その種類も多様化しています。しかし、従来の多くのシステムは、科学論文に含まれるグラフや図表、画像といった「非テキスト情報」(非構造化データとも呼ばれます)をうまく処理できないという課題を抱えていました。
これらの非テキスト情報は、実験結果やデータ解析の重要なエッセンスを含んでいますが、AIが直接理解できる形ではないため、手作業での解釈やデータ入力が必要となり、データの品質評価を難しくしていました。このギャップが、研究成果の分析、検証、共有の効率を妨げる大きな要因となっていたのです。
3者の役割と技術の融合
本協業では、カラクリ、東京大学、Upstageの3者がそれぞれの強みを融合し、この「非テキスト情報の壁」の解決に挑みます。それぞれの役割は以下の通りです。
-
カラクリ株式会社: AI実装およびエンジニアリング技術を提供し、具体的なソリューション開発を推進します。これまでのAI実装実績とLLM開発力が、現場での実用性を高めます。
-
東京大学大学院新領域創成科学研究科(岡田眞人教授): 理論的知見と長年の研究におけるリーダーシップを発揮し、プロジェクトの学術的基盤を確立します。科学研究の現場の深い理解が、AIソリューションの方向性を決定づけます。
-
Upstage AI株式会社: 大規模言語モデル(LLM)およびDocument Parse技術を活用し、高度な情報抽出と特徴解析を実現します。特に、グラフや図表といった非テキスト情報から意味のあるデータを読み解く技術が期待されます。
高性能LLM「Syn Pro」の活用
このプロジェクトの鍵となるのが、Upstageとカラクリが共同開発した高性能な日本語LLM「Syn Pro」の活用です。「Syn Pro」は、日本語性能において国内開発モデルとして第1位を獲得した実績(Upstage社・カラクリ社調べ、2025年10月時点のWeights & Biases Japan Nejumi Leaderboard 4の評価に基づく)があり、その高い言語理解力と情報処理能力が、非テキスト情報の解析や複雑な科学文献からの情報抽出に貢献します。
3者は連携し、AIを単なる計算ツールではなく、研究者の思考と推論を支援する「科学的パートナー」として位置づける新しいアプローチを提示します。これにより、自動化、透明性、協働性を兼ね備えた新たなAI研究モデルの確立を目指します。また、プロジェクトの成果については、知的財産権の確保に向けて検討が進められる予定です。
関係者からのコメント
東京大学大学院新領域創成科学研究科 岡田眞人教授のコメント
「AIは科学を変革する力を持っていますが、その前提となる“データの構造化”の重要性は、これまで十分に認識されてきませんでした。AI-Readyなデータ基盤を整え、UpstageのDocument AIに加えて、同社とカラクリが日本国内で共同開発したLLM (Syn Pro) が社会に広く実装されることで、研究機関や民間企業が長年抱えてきた本質的な課題を解決できる可能性を強く感じています。」
「さらに、ヘルスケアや製造業をはじめとする幅広い産業領域においても、この三者連携によるAIの取り組みが真の価値を発揮できる環境を築くことが、私の使命です。AI for Scienceの活用がまだ途上にある今こそ、この分野をリードする新たな世界を共に切り拓いていきたいと思います。」
Upstage AI株式会社 代表取締役 松下紘之氏のコメント
「カラクリ株式会社および東京大学とは、本プロジェクトのキックオフ以来、約半年にわたり、科学研究の現場におけるAI活用の可能性を共に探ってまいりました。今回、『AI for Science』の社会実装に向けて大きな一歩を踏み出せることを、大変うれしく思います。」
「Upstageは、グローバル市場で培ってきたDocument Intelligence技術を軸に、非構造データをAIが理解できる形へと変換し、研究や業務における知識活用を支援してきました。さらに今年10月には、カラクリとの共同開発により、国内開発モデルとして最高水準の日本語性能を誇るLLM『SynPro』をリリースし、科学研究のデータ解析と知識構造化を『安心・安全な環境』と『高いコスト効率性』のもとで実現する新たな基盤を整えました。」
「このプロジェクトチームが一体となって新たなシナジーを生み出すことで、AIが日本の科学研究、そしてその先の産業発展の可能性を大きく切り拓いていく未来を見据えて、その一つひとつの現場での価値創造を共に実現していきたいと考えています。」
カラクリ株式会社について
カラクリは「FriendlyTechnology」というビジョンを掲げ、大規模言語モデル(LLM)と高度なAI実装力で、産業・研究領域におけるDX(デジタルトランスフォーメーション)を推進するAIスタートアップです。同社は設立当初より、国立研究開発法人物質・材料研究機構(NIMS)との共同プロジェクトに参画するなど、研究機関との連携を積極的に行ってきました。
2018年からはトランスフォーマーモデルであるBERTの研究を開始し、2022年からはGPTを含む大規模言語モデルの研究に取り組んでいます。その技術を活かしたカスタマーサポート向けのSaaS事業では、高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾートなど、各業界のトップ企業に選ばれ続けています。
同社の詳細については、以下のURLをご参照ください。
Upstage AI株式会社について
Upstageは、安全性と高性能を兼ね備えた生成AIソリューションを提供しており、AmazonおよびAMDからも出資を受けているグローバルAIスタートアップです。同社は日本語に特化した次世代大規模言語モデルを新たにリリースし、高精度・高信頼なAIを日本の文脈に即して提供しています。保険、法律、医療といった規制産業のリーダー企業では、UpstageのAI技術を活用し、複雑で非構造的な文書を実用的なビジネス価値へと変換しています。
まとめ:AI for Scienceが拓く科学研究の未来
カラクリ、東京大学、Upstageの三者連携による「AI for Science」プロジェクトは、日本の科学研究に大きな変革をもたらす可能性を秘めています。データ活用の非効率性や暗黙知の壁といった長年の課題に対し、高性能な大規模言語モデルと現場起点のAI実装力で具体的な解決策を提示します。
特に、グラフや図表といった非テキスト情報の解析を可能にする「Syn Pro」の活用は、これまでAIが苦手としてきた領域に踏み込み、研究成果の分析・検証・共有を飛躍的に効率化することが期待されます。これにより、研究者はより創造的な活動に集中でき、新たな科学的発見が加速されるでしょう。
この取り組みは、日本の科学技術力の向上だけでなく、ヘルスケアや製造業といった幅広い産業領域へのAI適用を促進し、社会全体の発展に貢献するでしょう。AI for Scienceがまだ発展途上にある今だからこそ、この分野をリードする新たな世界が、このプロジェクトから切り拓かれることに期待が高まります。

