Box Extractとは?AIで企業の非構造化コンテンツを実用的なデータに変革
現代の企業活動において、日々膨大な量の情報が生成されています。しかし、その多くは「非構造化コンテンツ」として、十分な活用がされていないのが現状です。非構造化コンテンツとは、契約書、報告書、メール、PDFファイル、画像、音声データなど、決まった形式に整理されていない情報を指します。これらの情報の中には、ビジネスにとって非常に価値のあるデータが埋もれているにもかかわらず、手作業での分析や抽出には時間とコストがかかり、その真価を発揮できていませんでした。
このような課題に対し、Box, Inc.は2026年1月16日、画期的な新サービス「Box Extract」の一般提供を開始しました。Box Extractは、最先端のAIモデルを活用し、企業の非構造化コンテンツから必要な情報をインテリジェントに抽出し、実用的なデータへと変換することで、ワークフローの自動化、意思決定の加速、そしてビジネス成果の最大化を支援します。
Box Extractが企業のコンテンツを「実用的なデータ」に変えるAI
Box Extractを一言で説明するなら、「AIが文書の中から必要な情報を賢く見つけ出し、使いやすい形に整理してくれるツール」です。このサービスは、GoogleのGemini 3、AnthropicのClaude Opus 4.5、OpenAIのGPT 5.2といった、世界をリードするAI企業の先進的な生成AIモデルを基盤としています。これらの強力なAIモデルに、文書の意味や文脈を深く理解する「エージェント機能」を組み合わせることで、Box Extractは単なるテキスト抽出を超えた高度な情報抽出を実現します。
抽出された情報は「メタデータ」としてBox内に安全に保存されます。メタデータとは、「データに関するデータ」のことで、例えば契約書であれば、その契約の「満期日」や「契約当事者名」などがメタデータに該当します。このメタデータがあることで、企業はコンテンツをより効率的に管理・検索し、AI活用をさらに促進できるようになります。

Boxの共同創業者兼CEOであるアーロン・レヴィ氏は、「多くの企業では、手つかずのコンテンツの中に、貴重なデータを眠らせています。Box Extractにより、その情報が解き放たれ、企業が情報を分析し意思決定を行う方法を変革することが可能となります」と述べています。非構造化コンテンツを構造化された実用的なデータに変換することで、企業はビジネス全体でコンテンツを積極的に活用し、ビジネス成果を最大限に生み出すことができるのです。
なぜ今、Box Extractが必要なのか?非構造化コンテンツの課題と限界
企業が日々扱うデータのうち、約80%が非構造化データであると言われています。これらの非構造化データの中には、顧客情報、契約条件、製品仕様、市場トレンドなど、ビジネスの意思決定に不可欠な情報が豊富に含まれています。しかし、これまでこれらの情報から知見を引き出す試みは、以下のような課題に直面していました。
-
手作業による限界: 膨大な文書を手作業で読み込み、必要な情報を抽出するには、莫大な時間と人的コストがかかります。また、人為的なミスが発生するリスクも高まります。
-
レガシーツールの制約: 従来のデータ抽出ツールは、多くの場合、特定の形式やキーワードにしか対応できず、文書全体の意味や文脈を理解する能力に欠けていました。そのため、複雑な文書からの正確な抽出は困難でした。
-
拡張性の欠如: ビジネスの規模が拡大し、扱うコンテンツの量が増えるにつれて、従来の抽出方法は対応しきれなくなり、スケーラビリティに限界がありました。
-
情報へのアクセス遅延: 必要な情報がどこにあるのか分からず、見つけるまでに時間がかかるため、迅速な意思決定が阻害されていました。
Box Extractは、これらの課題に対し、最先端のAI技術と高度なエージェント機能を組み合わせることで、効率的かつ正確なデータ抽出を大規模に実現します。これにより、企業はこれまで「眠っていた」情報を「実用的なデータ」に変え、ビジネスの競争力を高めることが可能になります。
Box Extractの主な機能と特徴:AIが「賢く」情報を抽出
Box Extractは、単なるテキスト抽出ツールとは一線を画す、高度な機能と特徴を備えています。
1. 最先端AIモデルとエージェント機能による深い理解
GoogleのGemini 3、AnthropicのClaude Opus 4.5、OpenAIのGPT 5.2といった最新のAIモデルがBox Extractの基盤です。これらのモデルは、テキストだけでなく、画像や表などのマルチモーダルな情報も処理できる能力を持っています。さらに、Box Extractは「エージェント機能」を搭載しています。これは、文書の構造(段落、表、図表など)と意味を理解し、最も重要な情報を正確に抽出するための自律的なアプローチです。従来のツールが単にテキストを抽出するのに対し、Box Extractは文書全体の文脈を把握し、ビジネスにとって本当に価値のある部分を見つけ出すことができます。
2. ビジネスニーズに合わせたカスタム抽出エージェント
Box Extractの大きな強みの一つは、企業の特定のビジネスニーズに合わせて「カスタム抽出エージェント」を作成できることです。これにより、特定の業界特有の文書や、企業独自のフォーマットから情報を抽出するためのルールを柔軟に設定できます。作成したエージェントは、幅広いコンテンツに対して大規模かつ安全に展開できるため、企業全体のデータ抽出プロセスを標準化し、効率化することが可能です。
3. 抽出された情報の包括的な活用
Box Extractで抽出された情報は、コンテンツとともにBoxにメタデータとして保存されます。このメタデータを活用することで、以下のようなメリットが生まれます。
-
迅速な意思決定: Box Apps内のメタデータに基づくダッシュボードやビューを活用し、情報を視覚的に把握することで、より迅速かつ的確な意思決定が可能になります。
-
ワークフローの自動化: Box Relay(将来的にはBox Automate)と連携し、抽出されたメタデータをトリガーとして、承認プロセスやデータ入力などのワークフローをエンドツーエンドで自動化できます。
-
コンテンツの発掘と検索の効率化: メタデータが付与されることで、必要なコンテンツをキーワード検索するだけでなく、特定の条件(例:契約満期日が近い文書、特定の顧客に関連する報告書)でフィルタリングして、素早く探し出すことができます。
-
サードパーティ/カスタムアプリケーションとの連携: 抽出されたメタデータは、他のシステムやカスタムアプリケーションに表出し、拡張することができます。これにより、DatabricksやSnowflakeといったデータ分析プラットフォームへのエクスポートや同期も可能となり、より高度なデータ分析やビジネスインテリジェンスに活用できます。
Box Extractが活躍する具体的な活用事例
Box Extractは、その汎用性の高さから、さまざまな業界や部門で具体的なビジネス課題の解決に貢献します。
金融サービス業
金融サービス業界では、融資実行プロセスにおいて、返済期日や融資条件といった重要な情報を契約書から正確に抽出する必要があります。Box Extractは、これらの情報を自動抽出し、支払処理、照合、融資管理業務を加速させます。Valmark Financial Groupの最高情報責任者であるジェフ・ムーア氏は、Box Extractが「企業レベルのセキュリティ管理と従業員の深い専門知識を組み合わせ、非構造化された情報源からデータを抽出し、安全に実用可能なインサイトへと変換する」ことに成功し、効率性と正確さの両面で卓越した成果を上げたと評価しています。
政府および公共機関
政府機関や公共団体は、許可証、公文書、助成金、契約書など、膨大な量の非構造化文書を処理します。Box Extractは、許可の種類、手数料、検査日などの重要な詳細を自動抽出し、コンプライアンス業務の効率化や部門横断的なサービス提供を加速させます。テキサス州自動車局(TxDMV)のウェンディ・バロン氏は、Box AIの導入により「フォームや記録から重要な情報を自動抽出し、手動レビューを減らし、ワークフローを加速させることができる」と語り、同時に公共機関に求められるセキュリティとコンプライアンス基準も維持できる点を強調しています。
メディア&エンターテインメント企業
制作ファイルやクリエイティブアセット(脚本、タレント契約書、顧客向け資料など)から、タイトル、脚本家、バージョン、権利者、映像シーンのキーワードなどの詳細を自動的に抽出できます。これにより、特定のシーンを迅速に検索したり、デジタル資産を効率的に管理したりすることが可能になります。
保険会社
事故報告書、病院の請求書、事故画像などから重要な情報を自動抽出し、それをBoxのメタデータとして適用することで、調査担当者の作業効率化、手動レビューの削減、保険金請求処理の迅速化を実現します。
法務担当者
法務部門では、長期契約の処理や、リスクのある文言や条項の特定が重要な業務です。Box Extractは、先方当事者名、満期日、更新条件、条項、義務期限などの重要な契約詳細を自動的に取得し、メタデータとして適用することで、契約管理を大幅に強化します。
Google Cloudのプレジデント兼最高収益責任者であるマット・レナー氏は、Box ExtractへのGoogle Geminiの統合について、「今日のビジネス環境では、データの処理速度が事業成果を左右します。Geminiが持つ複雑で大量のデータを処理・理解する能力により、単純なスキャン作業から真のワークフロー自動化へと移行でき、融資承認や契約管理といった重要プロセスの劇的な高速化が可能になります」と、その効果に期待を寄せています。
Box Extractの提供形態:ニーズに合わせた選択肢
Box Extractでカスタム抽出エージェントを作成・管理する機能は、BoxのEnterprise Advancedプランの顧客向けに提供が開始されています。
Box Extract機能では、「Box AI抽出エージェント(標準)」と「Box AI抽出エージェント(強化)」の2種類の抽出エージェントを選択できます。
-
標準エージェント: 比較的単純なデータ取得を効率化し、迅速かつコスト効率の高い結果を提供します。
-
強化エージェント: マルチモーダルな文書構造に基づいた専門的な処理を実施し、より深い推論を適用します。これにより、大規模で複雑、かつ可変性の高い文書にも柔軟に対応できます。
企業は、自身のビジネス要件や予算に応じて、最適なエージェントタイプを選択し、Box Extractの能力を最大限に活用することが可能です。
まとめ:企業の未来を拓くBox Extract
Box Extractは、企業の「眠っていた」非構造化コンテンツを、AIの力で「実用的なデータ」へと変革する強力なツールです。このサービスは、手作業に頼っていた煩雑なデータ抽出作業を自動化し、ワークフローの効率化、意思決定の迅速化、そして情報へのアクセス向上を実現します。
金融、政府機関、メディア、保険、法務といった多様な業界での具体的な活用事例が示すように、Box Extractはあらゆるビジネスプロセスにおいて、時間とコストの削減、正確性の向上、そして最終的なビジネス成果の最大化に貢献する可能性を秘めています。AIの進化が止まらない現代において、Box Extractの導入は、企業のデジタル変革を加速させ、競争優位性を確立するための重要な一歩となるでしょう。
関連情報
Box Extractの詳細や、データ抽出がコンテンツの活用方法をどう変革するかについて、さらに詳しく知りたい方は、以下のリンクをご参照ください。

