製造業・ビジネスに革命!低コストでオンプレミス運用可能なドキュメント読解AI基盤『Stockmark-DocReasoner』が新登場

国産生成AIの進化!ストックマークが高速・高精度なドキュメント読解AI基盤を公開

近年、AI技術は目覚ましい進歩を遂げ、私たちの生活やビジネスに大きな変化をもたらしています。特に「生成AI」は、文章や画像を自動で生成する能力を持ち、多岐にわたる分野での活用が期待されています。そのような中、国産生成AIの開発をリードするストックマーク株式会社が、ビジネスや製造業の現場に特化した画期的なドキュメント読解AI基盤モデル「Stockmark-DocReasoner-Qwen2.5-VL-32B」を公開しました。このモデルは、経済産業省とNEDOが実施する国内の生成AI開発力強化プロジェクト「GENIAC」第3期の支援を受けて開発されたもので、高速かつ高精度なAIを企業内で安全かつ低コストで運用できる点が大きな注目を集めています。

「Stockmark-DocReasoner-Qwen2.5-VL-32B」とは?

「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、オープンモデルである「Qwen2.5-VL-32B-Instruct」をベースに、ストックマーク株式会社が培ってきた独自のAI基盤モデル開発ノウハウを融合させて誕生したマルチモーダル基盤モデルです。

マルチモーダルとは、テキストだけでなく、図表や画像といった複数の種類の情報を同時に理解し処理できる能力を指します。このモデルは、特にビジネスシーンで頻繁に利用される複雑なドキュメント、例えば報告書、契約書、技術仕様書などを正確に読み解くことを得意としています。さらに、製造業特有の化学式や図面など、高度な専門知識が必要なドキュメントの読解も可能です。

中型モデル「32B」がもたらす戦略的メリット

AIモデルの性能は、そのモデルが持つ「パラメータ数」によって大きく左右されることが一般的です。パラメータ数が多いほど、より複雑な情報を学習し、高性能を発揮すると言われています。しかし、大規模なモデルは運用に莫大な計算資源とコストが必要となり、企業が自社内で導入・運用する「オンプレミス運用」が難しいという課題がありました。一方で、軽量なモデルでは、コストは抑えられますが、ビジネスで求められる高い精度を実現することが困難でした。

「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、この二律背反を解決するために、32B(320億パラメータ)という「中型」のサイズを戦略的に採用しています。このサイズにストックマーク独自の開発ノウハウを組み合わせることで、大規模モデルに匹敵する「精度」と、業務を停滞させない「速度」を両立。結果として、汎用AIでは難しかったオンプレミス運用を低コストで実現できる、社会実装に最適な基盤モデルが誕生しました。

信頼性を高める「チェーンオブソート(CoT)」

生成AIが複雑な質問に回答する際、最終的な答えだけを提示するのではなく、その答えに至るまでの思考プロセスを段階的に示す技術を「チェーンオブソート(Chain of Thought、CoT)」と呼びます。このモデルはCoTを実現しているため、AIがどのように考えてその結論に至ったのかをユーザーが確認でき、ビジネスシーンで特に重要視される「信頼性」を大きく向上させます。これにより、単なる答えだけでなく、その根拠や思考過程も理解した上で、業務に活用することが可能になります。

モデル出力の例
モデル出力の例:チャート解析における思考プロセスと回答

「Stockmark-DocReasoner-Qwen2.5-VL-32B」の主な特徴

このモデルが企業にもたらす具体的なメリットは多岐にわたります。ここでは特に重要な3つの特徴を詳しく見ていきましょう。

1. オンプレミス運用の実現とデータ主権の保護

現代ビジネスにおいて、企業が保有するデータは最も重要な資産の一つです。特に、特許情報、未公開の技術ノウハウ、顧客情報といった秘匿性の高いデータは、外部のクラウドサービスに送信することなく、自社内で厳重に管理したいというニーズが高まっています。

「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、高いドキュメント読解性能を維持しつつ、大規模な汎用モデルとは異なり、限られたインフラ環境下でも十分にその能力を発揮できます。これにより、企業は機密性の高いデータを外部クラウドに送ることなく、自社設備内で安全に処理することが可能になります。これは、企業が自社のデータを完全にコントロールできる「データ主権」を保護することに直結し、最高水準のAI知能を導入しながらも、情報漏洩のリスクを最小限に抑えることができる画期的なソリューションと言えるでしょう。

2. 業務を止めない「高速レスポンス」

AIの活用が進む中で、その処理速度は業務効率に直結する重要な要素です。大規模なAIモデルは高度な処理能力を持つ一方で、回答生成に時間がかかるという課題がありました。「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、高度な論理推論能力を維持しながらも、生成速度を大幅に改善しています。

これにより、例えば製造現場での熟練工の作業解析や、設計支援におけるリアルタイムなフィードバックなど、精度だけでなく速度も求められる現場業務において、AIが「ストレスフリーな環境」を提供します。AIの応答を待つ時間が短縮されることで、従業員はよりスムーズに業務を進めることができ、全体の生産性向上に貢献します。

3. 高精度なドキュメント読解能力

このモデルの性能は、日本語のビジネスドキュメント読解と、特に専門性の高い製造業に関するドキュメント読解の2つの側面で評価されています。

日本語ビジネスドキュメント読解の性能評価

日本語の図表を含む質問応答データセット「JDocQA」を用いた評価では、「Stockmark-DocReasoner-Qwen2.5-VL-32B」はベースモデルである「Qwen2.5-VL-32B-Instruct」を大きく上回る結果を示しました。さらに、国内で広く活用されている「Qwen3-VL-32B-Instruct」と同等の高いスコアを記録し、世界的に見ても優れた性能を有していることが確認されています。

JDocQA Benchmark
JDocQAベンチマークにおけるモデル性能比較

製造業におけるドキュメント読解性能評価

ストックマーク株式会社が独自に作成した、製造業を中心としたドキュメントを対象とする質問応答ベンチマーク「JA-Business-Doc-RQ-Bench」でも、このモデルはベースモデルからの性能向上と高い性能を示しました。

JA-Business-Doc-RQ-Bench
JA-Business-Doc-RQ-Benchにおけるモデル性能比較

この評価結果は、モデルが企業の保有する社内データなどを継続的に学習することで、企業のドメインに精通した、より高精度な特化モデルを構築できる可能性を示唆しています。企業は自社の専門領域に合わせてAIを「ファインチューニング」(追加学習)することで、その効果を最大限に引き出すことができるでしょう。

専門領域への特化による圧倒的なタスク読解能力

「Stockmark-DocReasoner-Qwen2.5-VL-32B」をベースに、さらに特定の専門領域に特化させたカスタマイズモデルでは、一般的な大規模AIモデルでは到達できないような、極めて専門的なタスクも完遂できることが確認されています。

知識に基づく高度なリーズニング(知識と読解)

例えば、複雑な化学構造式から特定の原子数を特定するタスクにおいて、一般的な大規模AIモデル(フロンティアモデル)が誤った回答をする中でも、このモデルは構造式の細部と専門知識を正確に組み合わせて正しい答えを導き出します。これは、単に情報を読み取るだけでなく、その情報から論理的に推論する能力が非常に高いことを示しています。

知識と読解
化学構造式からの炭素原子数特定タスクにおけるモデル比較

技術情報の正確なデジタル化(SMILES変換)

また、化学構造式をテキスト形式の符号(SMILES)へ変換する際にも、手書きを含む複雑な図面からでさえ、非常に正確な符号化を実現します。これは、フロンティアモデルを凌駕する精度であり、企業の貴重な技術資産をデジタルデータとしてデータベース化する作業を強力に支援します。

SMILES変換
SMILES変換(化学式をテキスト形式に変換)におけるモデル出力例

これらの事例は、このモデルが特定の専門分野において、人間が行うような高度な判断や処理をAIが代替できる可能性を示しており、これまでのAIの限界を大きく超えるものです。

今後の展開と社会実装への貢献

ストックマーク株式会社は、この「Stockmark-DocReasoner-Qwen2.5-VL-32B」モデルを通じて、日本の製造業が直面する様々な課題解決に貢献することを目指しています。現在、複数の製造業パートナーとPoC(概念実証)を開始しており、特に「化学・機械ドメイン」における以下の課題解決を優先的に進めています。

  • R&D(研究開発): 過去のレポートから化学パラメータを自動で抽出し、構造式のSMILES化や電子実験ノート(ELN)との連携により、研究開発のスピードアップを支援します。

  • 生産技術・製造: 膨大な仕様書やPDFマニュアルの情報を、作業者が理解しやすいステップ形式の手順書へ自動で再編することで、熟練技術の伝承を円滑に進めます。

  • コンプライアンス・知財: SDS(安全データシート)や国際規格、法令など、複雑な要件が記載された文書から必要な情報を構造化して抽出することで、人手による読解コストや情報見落としのリスクを大幅に削減します。

ストックマーク株式会社は、このモデルが日本の製造業を「文書を処理する業務」という負担から解放し、本来の強みである「知識を活用する業務」へとシフトさせることで、生成AIの社会実装を強力に推進していくと述べています。

開発者の声:取締役CTO 有馬 幸介氏のコメント

ストックマーク株式会社の取締役CTOである有馬 幸介氏は、今回のモデル公開について次のようにコメントしています。

「GENIACを通じ、日本の製造現場が直面する『実務の壁』を突破するモデルを開発しました。32Bというサイズは、高速かつ高精度な推論とオンプレミス運用を両立する社会実装の黄金比です。化学式や図表をマルチモーダルに読解し、確かな思考過程を示すことで、現場での信頼性を担保しました。深刻な労働力不足や技術継承という課題に対し、データ主権を守りつつAIが『熟練の知』を即戦力化します。現場を単純な文書処理から解放し『知識を活用する業務』へとシフトさせる変革こそが、日本のモノづくりの競争力を再び世界へ押し上げる鍵になると確信しています。」

取締役CTO 有馬 幸介
ストックマーク株式会社 取締役CTO 有馬 幸介氏

このコメントからは、日本の産業が抱える具体的な課題に対し、AI技術でどのように貢献できるかという明確なビジョンが伝わってきます。特に、データ主権保護と熟練の知の活用という点は、多くの企業にとって重要な示唆となるでしょう。

GENIACプロジェクトについて

今回のモデル開発を支援した「GENIAC」は、経済産業省とNEDOが実施する、日本国内の基盤モデル開発力を強化し、企業の生成AI活用を促進するための国家プロジェクトです。

GENIACロゴ
GENIACロゴ

GENIACは、計算資源の提供、利活用企業やデータホルダーとのマッチング支援、グローバルテック企業との連携支援、コミュニティイベントの開催、開発される基盤モデルの性能評価など、多岐にわたる活動を通じて、日本の生成AI開発力向上を目指しています。このような国家プロジェクトの支援を受けながら開発された「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、日本のAI技術の発展における重要な一歩と言えるでしょう。

ストックマーク株式会社のソリューション

ストックマーク株式会社は、「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用して多くの企業の変革を支援しています。AI活用は現代ビジネスにおいて不可欠な要素となっていますが、多くの企業が「データが整備されていない」「現場への定着が進まない」「具体的な成果に繋がらない」といった課題に直面しています。

ストックマークは、これらの課題を包括的に解決するため、以下の6つのソリューションを提供しています。

Stockmark AIでビジネスを変革する6つのソリューション
ストックマーク株式会社が提供する6つのAIソリューション

  • データ/ナレッジマネジメント: 社内外のあらゆる情報をAIが学習可能な状態に整備し、知識の再利用と伝承を実現。

  • 戦略/意思決定支援: 複雑な非構造化データから市場動向を可視化し、戦略的な意思決定を支援。

  • 専門業務自動化: 専門業務プロセスを深く理解し、複雑な専門業務を高度に自動化。

  • システム内製化/受託開発: ノウハウを移転しながら、特定ベンダーに依存しない最適なシステムを共同開発。

  • 新価値創造: 技術シーズと市場ニーズのデータを解析し、根拠ある新規事業アイデアを創出。

  • 人材育成/カルチャー変革: 自律的なAI活用人材を育成し、データに基づく人的リソースの最適配置を支援。

これらのソリューションは、企業がAIを効果的に導入し、その恩恵を最大限に享受できるよう、多角的にサポートするものです。今回のドキュメント読解AI基盤も、これらのソリューションの一つとして、企業のDX(デジタルトランスフォーメーション)を加速させる重要な役割を担います。

ストックマーク株式会社の公式サイトはこちらです: https://stockmark.co.jp/

まとめ:AIが拓く新たなビジネスの未来

ストックマーク株式会社が公開したドキュメント読解AI基盤モデル「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、企業がAIを導入する上での大きな障壁であった「コスト」「セキュリティ」「精度」という課題を一挙に解決する可能性を秘めています。特に、データ主権を保護しながらオンプレミス運用が可能である点、そしてビジネスや製造業の複雑なドキュメントを高精度かつ高速で処理できる点は、多くの企業にとって計り知れない価値をもたらすでしょう。

このモデルは、日本の製造業が直面する労働力不足や技術継承といった深刻な課題に対し、AIが熟練の知を即戦力化し、現場を単純な文書処理から解放することで、日本のモノづくりの競争力を再び世界へ押し上げる鍵となるはずです。AI初心者の方も、この革新的な技術がどのようにビジネスを変革していくのか、今後の動向に注目してみてはいかがでしょうか。

モデル公開先

タイトルとURLをコピーしました