AIが拓く未来の医療:機械学習で2型糖尿病の30年を予測する新技術SReFT-MLを徹底解説
私たち現代社会において、高血圧や糖尿病といった慢性疾患は、多くの人々が抱える健康上の大きな課題です。これらの疾患は、一度発症すると長期にわたり進行し、患者さんの生活の質に大きな影響を与えるだけでなく、心臓病や腎臓病、神経障害といったさまざまな合併症を引き起こす可能性があります。
しかし、その進行は一人ひとり異なり、将来どのようなリスクが待ち受けているのかを正確に予測することは、これまで非常に困難でした。そんな中、千葉大学の研究グループが、機械学習という最先端のAI技術を駆使し、慢性疾患の長期的な進行を予測する画期的な新手法「SReFT-ML」を開発しました。この技術は、特に2型糖尿病において、なんと30年先までの疾患の進行を再現できるとされており、未来の医療に大きな変革をもたらす可能性を秘めています。
本記事では、AI初心者の方にもわかりやすい言葉で、このSReFT-MLの仕組みや、それがもたらす驚きの研究成果、そして今後の展望について詳しくご紹介します。
SReFT-MLとは?機械学習が拓く慢性疾患の生涯リスク予測
「SReFT-ML」は「Statistical Restoration of Fragmented Time course – Machine Learning」の略称で、「断片化された時系列データの統計的復元と機械学習」という意味合いを持ちます。この技術は、病気の長期的な進行を予測・理解するために開発されました。
従来のSReFTは複雑な統計モデルを用いていましたが、SReFT-MLではAIの一分野である「機械学習」を取り入れることで、大幅な計算効率の向上を実現しました。これにより、これまで数百人規模のデータでしか難しかった解析を、1万人以上の患者さん、そして約30種類もの検査値といった大規模なデータにも適用できるようになりました。
この技術の最大のポイントは、個々の患者さんの短期間の観察データから、生涯にわたる疾患の進行パターンを推定できる点にあります。まるで、短いスナップ写真から長い映画全体を予測するようなものです。
なぜ長期予測が難しいのか?研究の背景にある課題
慢性疾患、特に2型糖尿病のように数十年にわたって進行する病気の場合、その長期的な経過を理解し、将来を予測することは、最適な治療戦略を立てる上で極めて重要です。例えば、糖尿病の治療は、血糖値をコントロールするだけでなく、将来的な合併症のリスクをいかに減らすかが鍵となります。
しかし、一般的な臨床試験の観察期間は長くても数年程度であり、この短い期間の情報だけでは、病気の真の長期的な進行や、患者さん一人ひとりの予後を正確に把握することは困難でした。そのため、個々の患者さんに合わせた「個別化医療」に反映されるべき情報を収集することが難しいという問題があったのです。
このような課題に対し、研究グループは、実際に数十年にわたる疫学研究を行う代わりに、疾患進行の数理モデルを設計するというアプローチを試みました。そして、以前にSReFTという強力な手法を開発しましたが、この手法は大規模データに対して計算負荷が高いという課題がありました。
そこで、本研究ではこの課題を克服するため、計算コストを大幅に抑えたSReFT-MLを開発し、大規模な臨床試験データに適用することで、2型糖尿病の生涯にわたる進行モデルを構築することを目指したのです。
SReFT-MLが2型糖尿病の30年を再現!驚きの研究成果
本研究では、米国の公開臨床試験リポジトリ組織であるBioLINCCに登録されているACCORD試験のデータを使用しました。これは、糖尿病患者さんの心血管イベントリスクに血糖コントロールが及ぼす影響を明らかにするために実施された、約1万例の被験者が参加した大規模な臨床試験です。研究グループは、この試験に参加した約1万例の患者さんの、29種類に及ぶバイオマーカー(生体指標)の経時的なデータに対してSReFT-MLを適用しました。
SReFT-MLは、患者さん一人ひとりの断片的な臨床観測データから、まるでパズルのピースを組み合わせるように、経過の連続性を仮定して発症からの経過時間(疾患時間)の順にデータを並べ替えます。これにより、個々の患者さんのデータが、疾患が進行する共通の軸上に再配置され、最終的にバイオマーカーの生涯にわたる変化を推定することが可能になりました。この概念は、以下の図1で示されています。

図1は、SReFTおよびSReFT-MLの解析プロセスを示しています。左側は個々の患者さんの断片的な観察データで、観察期間が短いことがわかります。中央では、これらの断片的なデータを「疾患時間」という共通の軸に沿って並べ替えることで、連続した進行パターンを復元する様子が描かれています。そして右側では、復元されたデータから、生涯にわたるバイオマーカーの変化が推定されています。SReFT-MLは、この再配置されたデータに基づいて、死亡率や合併症発症リスクの疾患進行に伴う変化も予測することを可能にしました。
複数のバイオマーカーが疾患進行とともに一貫した変化
SReFT-MLの解析により、複数のバイオマーカーが疾患時間に沿って一貫した変化パターンを示すことが確認されました。例えば、腎機能を示すeGFR(糸球体濾過量)は疾患時間とともに低下し、拡張期血圧(DBP)や心拍数(HR)も低下する傾向が見られました。また、2型糖尿病の合併症として知られる神経障害スコアは増加するなど、臓器機能や生理状態が悪化する方向性の変化が特徴的でした。これは、血糖コントロールが良好な場合(HbA1cの変化が少ない様子が再現されています)でも、病気が着実に進行していることを示唆しています。
以下の図2では、これらのバイオマーカーの変化と、疾患進行に伴う死亡率や合併症リスクの予測が示されています。

図2の上段は、疾患時間に応じた複数のバイオマーカーの変化を示しています。標準血糖降下療法(赤線)と強化血糖降下療法(青線)のどちらの治療群でも、血糖指標であるHbA1cは比較的安定していますが、腎機能(eGFR)の低下や神経障害スコアの増加など、他の重要な指標が悪化している様子が再現されています。下段の青線は、カプランマイヤー曲線(生存曲線)とネルソン-アーレン曲線(ハザード曲線)で、観察対象が時間とともにどれくらい生き延びたか、そしてリスクが累積する様子を表しています。オレンジ線は、ゴンペルツ関数という数理モデルで予測したリスクの変化です。この図からは、疾患時間に沿って心血管死のリスクが30年スケールでダイナミックに変化する様子が捉えられ、SReFT-MLが長期的なイベントリスクを正確に予測できる能力を持っていることがわかります。
このような研究結果から、SReFT-MLは従来の年齢や観察期間での解析と比較して、以下の点で大きな利点があると言えます。
-
疾患進行の個別推定: 患者さん一人ひとりの疾患進行の「進度」を推定できるため、病気の進行が早いグループと遅いグループを識別できます。これにより、より個別化された治療計画の立案に役立ちます。
-
時系列的な介入効果の評価: 疾患軸に沿った変化として、特定の治療法や生活習慣の介入が、病気の進行にどのような影響を与えるかを時系列で評価することが可能です。
-
リスク因子の影響評価: どのような要因が疾患の進行を早めるのか、あるいは遅らせるのかといったリスク因子の影響をより詳細に分析できます。
SReFT-MLの仕組みを深掘り:なぜ機械学習が「疾患時間」を復元できるのか?
SReFT-MLが画期的なのは、患者さんの「疾患時間軸」を復元するという考え方に基づいている点です。私たちの体は、年齢を重ねるにつれて変化しますが、病気の進行は必ずしも年齢と同じ速さではありません。同じ年齢でも、病気の進行度合いは人それぞれ異なります。
SReFT-MLは、この「疾患時間」という、病気が発症してからどれくらい時間が経ったか、あるいは病気がどれくらい進行しているかを示す仮想的な時間を、機械学習を使って推定します。具体的には、多数の患者さんの様々なバイオマーカーデータ(血液検査値や血圧など)を機械学習モデルに入力します。機械学習モデルは、これらの膨大なデータの中から、病気の進行に共通するパターンや特徴を自動的に学習します。
例えば、特定のバイオマーカーがどのように変化すれば、病気が進行していると判断できるのか、あるいは合併症のリスクが高まるのかといった関係性を学習するのです。この学習結果を基に、個々の患者さんの断片的なデータであっても、機械学習モデルは「もしこの患者さんが、この病気の進行軸のこの位置にいたら、どのようなバイオマーカーの値を示すだろうか」という予測を立て、データが最も自然につながるように「疾患時間」を推定し、データを再配置します。
これにより、たとえ短い期間の観察データしかなくても、その患者さんが病気の発症から現在まで、そして未来に向けてどのような経過をたどっているのかを、あたかも数十年にわたる連続したデータがあるかのように再現できるのです。このプロセスは、複雑な非線形混合効果モデル理論と機械学習の強みを組み合わせることで実現されており、特に大規模なリアルワールドデータ(実際の医療現場で得られるデータ)の解析に非常に適しています。
未来の医療への展望:SReFT-MLがもたらす可能性
今回のSReFT-MLの開発は、医療の未来に大きな期待を抱かせます。
まず、新しい治療法の開発において、より効果的な臨床試験の設計に貢献するでしょう。SReFT-MLによって疾患の進行パターンが明確になることで、どの段階の患者さんにどのような治療が最も効果的であるかを、より正確に予測できるようになります。これは、新薬開発の効率化にもつながる可能性があります。
また、患者さん一人ひとりに最適化された「個別化医療」の実現にも大きく寄与します。医師は、SReFT-MLが予測する患者さんの疾患時間軸や将来のリスクに基づいて、よりパーソナルな治療計画や生活指導を行うことが可能になります。これにより、患者さんは自分にとって最適な治療を、最適なタイミングで受けられるようになるでしょう。
さらに、日常の医療現場で蓄積される膨大なリアルワールドデータを活用し、より多くの疾患に対する予測モデルを構築できる可能性があります。心臓病、腎臓病、アルツハイマー病など、他の様々な慢性疾患への応用も期待されており、SReFT-MLは、これまで見過ごされがちだった疾患進行の共通パターンが明らかになり、早期介入や予防策の強化にもつながるでしょう。SReFT-MLは、より健康で質の高い生活を送るための未来の医療を形作る鍵となるかもしれません。
国際的な評価:PhRMA Foundation Trainee Challenge Award受賞
本研究の成果は、その質の高さと医療分野への大きなインパクトが認められ、米国研究製薬工業協会(PhRMA)財団と米国臨床薬理学会(ASCPT)が共同実施したコンテストにて、「2025 PhRMA Foundation Trainee Challenge Award」を受賞しました。
この賞は、臨床・トランスレーショナル科学における将来のリーダーとして認知されるべき若手研究者を表彰するもので、特に2025年は「AI/機械学習」がテーマの論文から、その質、インパクト、新規性、時宜性が厳しく審査されました。本論文を含む6論文の第一著者が受賞したことは、SReFT-MLがAI/機械学習分野における最先端の研究として、国際的に高く評価されている証と言えるでしょう。
この賞に関する詳細は、以下の参考資料で確認できます。
論文情報
本研究の成果は、米国臨床薬理学会の公式ジャーナル「Clinical and Translational Science」に2025年10月23日に公開されています。
-
タイトル: Development of a Novel Machine Learning Method for Estimation of Life-Long Chronic Disease Progression and Its Application to Type 2 Diabetes
-
著者: Yamato Sano, Ryota Jin, Hideki Yoshioka, Yuki Nakazato, Hiromi Sato, Akihiro Hisaka
-
雑誌名: Clinical and Translational Science
-
DOI: 10.1111/cts.70351
まとめ
SReFT-MLは、AIと機械学習の力を借りて、慢性疾患の長期的な進行予測という長年の課題に新たな光を当てました。この革新的な技術は、断片的なデータから患者さんの生涯にわたる疾患の進行を再現し、個別化された治療戦略や新薬開発の効率化に貢献するでしょう。この技術が、多くの患者さんの健康維持と、より質の高い医療の実現に貢献することを期待します。

