論文No3452
Differentiation of malignant from benign pleural effusions based on artificial intelligence (30 September, 2022) 
Sufei Wang, Xueyun Tan, Piqiang Li, Qianqian Fan, Hui Xia, Shan Tian, Feng Pan, Na Zhan, Rong Yu, Liang Zhang, Yanran Duan, Juanjuan Xu, Yanling Ma, Wenjuan Chen, Yan Li, Zilin Zhao, Chaoyang Liu, Qingjia Bao, Lian Yang, Yang Jin
Thorax 2023;78:376-382.

<背景>

本研究では、胸部CT画像に基づく人工知能モデルを構築し、

良性胸水(BPE)と悪性胸水(MPE)の鑑別を行うことを目的とした。

<方法>

 最初に胸水患者918例を対象とし、無作為に選択した607例をトレーニングコホートとして、

残りの311例を内部テストコホートとして使用し、362例を含む別の独立した外部テストコホートも使用した。

3次元空間強調U-Netと2次元古典U-Netを組み合わせて、胸水セグメンテーションモデル(M1)を開発した。

次に、CTボリュームとその3D胸水マスクを入力として、BPEとMPEを識別する分類モデル(M2)を構築した。

<結果>

 M1の平均Dice類似度係数、Jaccard係数、精度、感度、Hausdorff距離95%(HD95)、平均表面距離指標は

それぞれ87.6±5.0%, 82.2±6.2%, 99.0±1.0%, 83.0±6.6%, 6.9±3.8, 1.6±1.1 であり、

3D U-Net および3D空間加重 U-Net より優れていた。

M2については、外部テストコホートにおいて、Volume concat masksを入力として得られた

受信者動作特性曲線下面積、感度、特異度は、

0.842(95% CI 0.801~0.878),89.4%(95% CI 84.4%~93.2%),65.1%(95% CI 57.3%~72.3%) となった。

これらの性能指標は、他の入力パターンに対するものと比較して、大幅に改善された。

<感想>

BPEとMPEの鑑別診断において、胸部CT画像に基づく人工知能モデルは良好な結果を示した。

 

 

 

 

 

 



Introduction This study aimed to construct artificial intelligence models based on thoracic CT images to perform segmentation and classification of benign pleural effusion (BPE) and malignant pleural effusion (MPE).

Methods A total of 918 patients with pleural effusion were initially included, with 607 randomly selected cases used as the training cohort and the other 311 as the internal testing cohort; another independent external testing cohort with 362 cases was used. We developed a pleural effusion segmentation model (M1) by combining 3D spatially weighted U-Net with 2D classical U-Net. Then, a classification model (M2) was built to identify BPE and MPE using a CT volume and its 3D pleural effusion mask as inputs.

Results The average Dice similarity coefficient, Jaccard coefficient, precision, sensitivity, Hausdorff distance 95% (HD95) and average surface distance indicators in M1 were 87.6±5.0%, 82.2±6.2%, 99.0±1.0%, 83.0±6.6%, 6.9±3.8 and 1.6±1.1, respectively, which were better than those of the 3D U-Net and 3D spatially weighted U-Net. Regarding M2, the area under the receiver operating characteristic curve, sensitivity and specificity obtained with volume concat masks as input were 0.842 (95% CI 0.801 to 0.878), 89.4% (95% CI 84.4% to 93.2%) and 65.1% (95% CI 57.3% to 72.3%) in the external testing cohort. These performance metrics were significantly improved compared with those for the other input patterns.

Conclusions We applied a deep learning model to the segmentation of pleural effusions, and the model showed encouraging performance in the differential diagnosis of BPE and MPE.