論文No3794
Radiomics analysis to predict pulmonary nodule malignancy using machine learning approaches 
Matthew T Warkentin, Hamad Al-Sawaihey, Stephen Lam, Geoffrey Liu, Brenda Diergaarde, Jian-Min Yuan, David O Wilson, Sukhinder Atkar-Khattra, Benjamin Grant, Yonathan Brhane, Elham Khodayari-Moez, Kiera R Murison, Martin C Tammemagi, Kieran R Campbell, Rayjean J Hung
Thorax 2024;79:307-315.

<背景>

 低線量CTスクリーニングは肺癌関連死亡率を減少させることができる。

しかし、スクリーニングで検出された肺異常のほとんどはがんに進展せず

特に判定不能な結節の中から悪性結節を同定することは依然として困難であることが多い。

われわれは、ベースライン検診で検出された肺病変の良性と悪性を識別するための、

放射線学的特徴に基づく予測モデルを開発し、評価することを目的とした。

<方法>

 4つの国際的な肺がん検診研究を用いて、6865人の参加者の16 797個の結節(513個が悪性)

それぞれについて2060個の放射線学的特徴を抽出した。

低品質な放射線学的特徴をフィルタリングした後、モデル開発のために642の放射線学的特徴と9の疫学的特徴が残った。

クロスバリデーションとグリッドサーチを用いて、

3つの機械学習(ML)モデル(eXtreme Gradient Boosted Trees、ランダムフォレスト、

最小絶対縮小選択演算子(LASSO))の肺結節の悪性リスクを正確に予測する能力を評価した。

ホールドアウトテストセットにおける曲線下面積(AUC)とキャリブレーション指標に基づくモデル性能を報告する。

<結果>

 LASSOモデルは、クロスバリデーションにおいて最高の予測性能を示し、

最適化されたハイパーパラメータに基づき、全トレーニングセットにおいて適合した。

我々のラジオミクスモデルは、テストセットのAUCが0.93(95%CI 0.90~0.96)であり、

結節評価において確立されたPan-Canadian Early Detection of Lung Cancerモデル

(AUC 0.87、95%CI 0.85~0.89)を上回った。

我々のモデルは、固結節(AUC 0.93、95%CI 0.89~0.97)および

亜固結節(AUC 0.91、95%CI 0.85~0.95)のいずれにおいても良好な結果を示した。

<結論>

 我々は、4つの国際的な肺癌スクリーニング研究から得られた放射線学的および疫学的特徴に基づき、

スクリーニングで検出された肺結節の悪性リスクを評価するのに適した高精度のMLモデルを開発した。

DeepL.com(無料版)で翻訳しました。

 

 

 


Background Low-dose CT screening can reduce lung cancer-related mortality. However, most screen-detected pulmonary abnormalities do not develop into cancer and it often remains challenging to identify malignant nodules, particularly among indeterminate nodules. We aimed to develop and assess prediction models based on radiological features to discriminate between benign and malignant pulmonary lesions detected on a baseline screen.

Methods Using four international lung cancer screening studies, we extracted 2060 radiomic features for each of 16 797 nodules (513 malignant) among 6865 participants. After filtering out low-quality radiomic features, 642 radiomic and 9 epidemiological features remained for model development. We used cross-validation and grid search to assess three machine learning (ML) models (eXtreme Gradient Boosted Trees, random forest, least absolute shrinkage and selection operator (LASSO)) for their ability to accurately predict risk of malignancy for pulmonary nodules. We report model performance based on the area under the curve (AUC) and calibration metrics in the held-out test set.

Results The LASSO model yielded the best predictive performance in cross-validation and was fit in the full training set based on optimised hyperparameters. Our radiomics model had a test-set AUC of 0.93 (95% CI 0.90 to 0.96) and outperformed the established Pan-Canadian Early Detection of Lung Cancer model (AUC 0.87, 95% CI 0.85 to 0.89) for nodule assessment. Our model performed well among both solid (AUC 0.93, 95% CI 0.89 to 0.97) and subsolid nodules (AUC 0.91, 95% CI 0.85 to 0.95).

Conclusions We developed highly accurate ML models based on radiomic and epidemiological features from four international lung cancer screening studies that may be suitable for assessing indeterminate screen-detected pulmonary nodules for risk of malignancy.