サンプリングの不平等は神経画像の一般化に影響を与える
ホームページホームページ > ニュース > サンプリングの不平等は神経画像の一般化に影響を与える

サンプリングの不平等は神経画像の一般化に影響を与える

Jun 03, 2024

BMC Medicine volume 21、記事番号: 241 (2023) この記事を引用

1163 アクセス

1 引用

3 オルトメトリック

メトリクスの詳細

精神障害の診断を支援する機械学習モデルの開発は、精神医学の分野における重要な進歩として認識されています。 しかし、このようなモデルの臨床実践は依然として課題であり、一般化可能性が低いことが大きな制限となっています。

今回我々は、精神医学文献にある神経画像ベースのモデルについて事前に登録されたメタリサーチ評価を実施し、比較的十分に調査されていない観点から、ここ数十年にわたる世界的および地域的なサンプリング問題を定量的に調査した。 合計 476 件の研究 (n = 118,137) が現在の評価に含まれました。 これらの調査結果に基づいて、精神科診断用の既存の機械学習モデルの品質を定量的に評価するための包括的な 5 つ星評価システムを構築しました。

これらのモデルにおける世界的なサンプリングの不平等が定量的に明らかになりました (サンプリング ジニ係数 (G) = 0.81、p < .01)。国 (地域) によって異なります (例: 中国、G = 0.47、米国、G = 0.58、ドイツ)。 、G = 0.78、英国、G = 0.87)。 さらに、このサンプリングの不平等の深刻さは、国民経済レベルによって有意に予測されました(β = − 2.75、p < .001、R2adj = 0.40; r = − .84、95% CI: − .41 ~ − .97)。より高い分類精度を報告するためにより高いサンプリング不平等が得られ、モデルのパフォーマンスが妥当に予測可能でした。 さらなる分析により、独立したテストの欠如 (モデルの 84.24%、95% CI: 81.0 ~ 87.5%)、不適切な相互検証 (モデルの 51.68%、95% CI: 47.2 ~ 56.2%)、技術的な透明性の低さ (87.8%) が示されました。モデルの割合、95% CI: 84.9 ~ 90.8%)/可用性 (モデルの 80.88%、95% CI: 77.3 ~ 84.4%) は、時間の経過とともに改善されたにもかかわらず、現在の診断分類器で普及しています。 これらの観察に関連して、独立したクロスカントリーサンプリング検証を行った研究では、モデルのパフォーマンスが低下していることがわかりました (すべて p < .001、BF10 > 15)。 これを考慮して、私たちは専用の定量的評価チェックリストを提案しました。このチェックリストは、これらのモデルの全体的な評価は出版年ごとに増加しましたが、モデルのパフォーマンスと負の相関があることを実証しました。

同時に、サンプリングの経済的平等性、ひいては機械学習モデルの品質を向上させることは、神経画像ベースの診断分類子を臨床実践にもっともらしく導入するために重要な側面となる可能性があります。

査読レポート

機械学習 (ML) モデルは、臨床上の意思決定を支援するために精神疾患患者を分類するために広く利用されてきました [1、2]。 神経画像ベースの特徴からトレーニングされた機械学習モデルを構築することで、これらの客観的かつ高次元のバイオマーカーを利用して、診断の決定がより正確で信頼できるものになる可能性があります [3、4]。 さらに、脳の特徴の多変量の性質を考慮すると、機械学習技術は、これらの疾患の病態生理学的兆候を明らかにするために、大容量依存ボクセル全体の神経パターン全体をキャプチャできる可能性があります。また、神経画像ベースの ML モデルにおける機械学習モデルの個別予測により、次のことが容易になります。高精度精神医学のニーズの高まりに対応します[5、6]。 この目的のために多大な努力が払われているにもかかわらず、診断と治療の推奨のための機械学習分類を臨床実践に移すことは依然として困難です [7]。 これは、特定の神経画像ベースの分類器の一般化可能性が低いことが部分的に原因であり、これらの分類器は多くの場合、特定のサンプル内で最適化され、新しいサンプルの未確認の患者を診断するための一般化の失敗が発生します [8、9、10]。 これらの分類器は、特定のコホートにおいて望ましい高い精度を達成するように訓練することができますが、医療センター、地理的地域、社会経済的地位、民族グループにわたるより一般的な集団を代表するものではありません [11、12]。 さらに、ここ数十年でデータのサイズが大幅に増加したにもかかわらず、一般化可能性に対する根強い懸念は潜在的なサンプリングバイアスを暗示しています[13]。

 3 for strong evidence. To examine the non-linear associations of these variables of interest, we have built the generalized additive model (GAM) with natural shape-free spline functions by R package (“mgcv”). To obviate overfitting, the shape-free splines (i.e., smooth function) were used in these models. Finally, metrics of model performance (i.e., classification accuracy) for each study were precision-weighted rather than the original ones as reported./p>