分享:
分享到微信朋友圈
X
临床研究
集成机器学习模型联合磁共振视觉及DTI直方图预测成人弥漫性胶质瘤IDH表型的研究
韩鑫 李笑然 卢洁

Cite this article as: HAN X, LI X R, LU J. Prediction of adult-type diffuse gliomas IDH phenotype through an ensemble machine learning model with integrating of MRI visual and DTI histogram[J]. Chin J Magn Reson Imaging, 2024, 15(11): 51-59, 89.本文引用格式:韩鑫, 李笑然, 卢洁. 集成机器学习模型联合磁共振视觉及DTI直方图预测成人弥漫性胶质瘤IDH表型的研究[J]. 磁共振成像, 2024, 15(11): 51-59, 89. DOI:10.12015/issn.1674-8034.2024.11.009.


[摘要] 目的 探索基于堆叠泛化整合磁共振视觉和扩散张量成像(diffusion tensor imaging, DTI)直方图的集成学习模型预测成人弥漫性胶质瘤异柠檬酸脱氢酶(isocitrate dehydrogenase, IDH)表型的价值。材料与方法 回顾性分析经2021版WHO中枢神经系统肿瘤分类指南确定的106例成人弥漫性胶质瘤常规MRI及DTI影像,对常规MRI进行伦勃朗视觉感受图像(visually accessible Rembrandt images, VASARI)特征评价,并测量DTI图像的各向异性分数、相对各向异性、容积比各向异性和平均扩散率的绝对值、相对值以及对应的直方图特征。采用递归式特征消除(recursive feature elimination, RFE)和Boruta算法在训练集进行特征筛选,并基于堆叠泛化法将VASARI特征、DTI临床参数及DTI直方图的高斯朴素贝叶斯模型(Gaussian Naive Bayes, GNB)与支持向量机(support vector machine, SVM)集成,建立预测成人弥漫性胶质瘤IDH表型的集成式机器学习模型。采用受试者工作特征曲线下面积(area under the curve, AUC)评估各模型性能。结果 106例成人弥漫性胶质瘤(50.05±15.17岁,54例男性)包括55例IDH突变型与51例IDH野生型。RFE与Boruta的级联递归降维分别筛选出6个VASARI特征、8个DTI临床参数特征及8个DTI直方图特征建立初级层分类器。基于DTI直方图的初级分类器的AUC最高(0.90/0.87,训练集/测试集),优于DTI临床参数构建的模型(AUC:0.83/0.78,训练集/测试集)和常规MRI视觉特征构建的模型(AUC:0.84/0.66,训练集/测试集)。基于堆叠泛化的集成学习模型预测IDH表型的AUC最高(0.92/0.89,训练集/测试集)。结论 基于堆叠泛化的集成机器学习模型融合常规磁共振视觉特征和DTI特征能准确预测成人弥漫性胶质瘤IDH基因表型,辅助临床快速评估成人弥漫性胶质瘤患者的预后。
[Abstract] Objective To investigate the value of ensemble learning model constructed based on MRI visual and diffusion tensor imaging (DTI) histogram for predicting isocitrate dehydrogenase (IDH) phenotypes in adult-type diffuse gliomas.Materials and Methods A retrospective analysis was conducted on conventional MRI and DTI images of 106 adult diffuse gliomas identified by the 2021 edition of the WHO Classification of Central Nervous System Tumors. Visually accessible Rembrandt images (VASARI) features were evaluated on conventional MRI. The absolute and relative values of fractional anisotropy (FA), relative anisotropy (RA), volume ratio anisotropy (VR), and mean diffusivity (MD) of DTI images were measured, as well as the histogram features. Recursive feature elimination (RFE) and Boruta algorithms were used for feature screening in the training set, and Gaussian Naive Bayes (GNB) models of VASARI features, DTI clinical parameters and DTI histograms were ensembled with a support vector machine (SVM) based on the stacking method. The ensemble machine learning model was then used to predict the IDH phenotype of adult diffuse gliomas. The performance of each model was evaluated by measuring the area under the curve (AUC) of receiver operating characteristic curves.Results A total of 106 glioma patients (50.05±15.17 years old, 54 males) were enrolled in the study, comprising 55 patients with IDH-mutant and 51 patients with IDH wildtype. The cascade recursive dimension reduction of RFE and Boruta, respectively, identified six VASARI features, eight DTI clinical parameters features, and eight DTI histogram features as the primary layer classifier. The model constructed based on histogram features had the highest AUC (0.90/0.87, training set/test set), which was superior to the model constructed from DTI clinical parameters (AUC: 0.83/0.78, training dataset/testing dataset) and the model constructed from conventional MRI visual features (AUC: 0.84/0.66, training dataset/testing dataset). The ensemble learning model based on stacking generalization achieved the highest AUC for predicting IDH phenotype (0.92/0.89 for the training dataset/testing dataset).Conclusions The ensemble learning model based on the combined conventional MRI features and DTI features can effectively predict the IDH genotype of adult-type diffuse gliomas before surgery and assists in the rapid clinical assessment of the prognosis.
[关键词] 胶质瘤;磁共振成像;扩散张量成像;集成机器学习;异柠檬酸脱氢酶
[Keywords] glioma;magnetic resonance imaging;diffusion tensor imaging;ensemble machine learning;isocitrate dehydrogenase

韩鑫 1, 2   李笑然 1, 2   卢洁 1, 2*  

1 首都医科大学宣武医院放射与核医学科,北京 100053

2 磁共振成像脑信息学北京市重点实验室,北京 100053

通信作者:卢洁,E-mail: imaginglu@hotmail.com

作者贡献声明:卢洁设计本研究的方案,对稿件重要内容进行了修改,获得了国家重点研发计划项目的资助;韩鑫起草和撰写稿件,获取、分析并解释本研究的数据;李笑然获取、分析并解释本研究的数据,对稿件重要内容进行了修改;全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。


基金项目: 国家重点研发计划项目 2022YFC2406900
收稿日期:2024-06-26
接受日期:2024-11-10
中图分类号:R445.2  R730.264 
文献标识码:A
DOI: 10.12015/issn.1674-8034.2024.11.009
本文引用格式:韩鑫, 李笑然, 卢洁. 集成机器学习模型联合磁共振视觉及DTI直方图预测成人弥漫性胶质瘤IDH表型的研究[J]. 磁共振成像, 2024, 15(11): 51-59, 89. DOI:10.12015/issn.1674-8034.2024.11.009.

0 引言

       脑胶质瘤占原发恶性脑肿瘤的80%,是最常见的恶性脑肿瘤,其中约57%为胶质母细胞瘤,恶性程度高,平均5年生存率仅7%,患者平均无进展生存时间不足24个月[1, 2]。2021年版WHO中枢神经系统肿瘤分类将成人弥漫性胶质瘤依据异柠檬酸脱氢酶(isocitrate dehydrogenase, IDH)突变状态划分为胶质母细胞瘤(IDH野生型)、星形细胞瘤(IDH突变型不伴1p/19q共缺失)及少突胶质细胞瘤(IDH突变伴1p/19q共缺失)[3]。预测胶质瘤IDH突变状态对于划定手术范围和疗效评价等至关重要,依据不同分子分型制订的治疗策略可提高患者生存期约17.2个月[4, 5]。目前对于胶质瘤IDH状态的判断有赖于手术病理组织DNA测序技术,但操作有创且存在一定滞后性,仍缺乏术前无创评估方法。

       MRI作为胶质瘤患者术前评估的重要组成部分,包括了常规序列和功能序列,两种序列可以从不同方面提供胶质瘤特征信息;伦勃朗视觉感受图像(visually accessible Rembrandt images, VASARI)特征集由美国癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库团队的放射学家开发,是脑胶质瘤标准化的视觉MRI影像特征,是对胶质瘤MRI影像特征的一种定量及半定量描述,可以更准确地评价胶质瘤的常规MRI影像特征,已有研究证明了VASARI特征集用于胶质瘤术前预测分子基因型、分级等方面的可靠性[6, 7]。此外,扩散张量成像(diffusion tensor imaging, DTI)作为扩散加权成像技术的发展,不仅可以评估组织内水分子扩散受限情况,还可以评估水分子扩散各向异性程度,从而反映肿瘤组织微观病理特征,反映各向异性的参数有各向异性分数(fractional anisotropy, FA)、相对各向异性(relative anisotropy, RA)和容积比各向异性(volume ratio anisotropy, VR)等,而平均扩散率(mean diffusivity, MD)参数可以反映组织中水分子扩散的平均程度[8, 9],既往研究已证明DTI参数在预测胶质瘤IDH基因状态方面的潜力,且采用直方图特征分析方法可获得更多反映肿瘤异质性的特征,从而更加全面地评估肿瘤的生物学特征[10, 11]。然而,如何整合常规MRI视觉特征与DTI定量参数特征共同预测IDH基因状态有待进一步探索。

       此外,人工智能在医学图像处理领域的应用已是当前研究的热点。已有报道结合DTI参数的多种机械学习模型可以实现术前更加精准地预测胶质瘤分子分型、分级和预后等[12, 13, 14]。但缺乏集成学习模型在这些方面应用的探索。集成学习是一种减少过度拟合的方法,该算法在原始训练集的随机子集上构建多个模型,然后聚合它们各自的预测以形成最终预测,来减少模型的方差。目前,尚未有研究报道集成学习模型用于术前预测胶质瘤IDH基因状态。因此,本研究目的是探索基于常规MRI特征和DTI参数特征的集成学习模型在预测胶质瘤IDH基因状态中的价值,旨在构建一个综合的MRI模型,以实现对脑胶质瘤IDH基因状态的精准预测,为临床制订个性化的治疗方案提供支持。

1 材料与方法

1.1 研究对象

       回顾性分析2019年2月至2023年5月在我院病理证实的胶质瘤患者的常规MRI及DTI影像,且具备IDH、1号染色体短臂及19号染色体长臂、端粒酶逆转录酶及表皮生长因子受体等完善的分子病理信息,可经2021版WHO中枢神经系统肿瘤分类指南确定为成人弥漫性胶质瘤。本研究遵守《赫尔辛基宣言》,通过宣武医院伦理委员会审查(伦理批件号:临研审[2023]044号),免除受试者知情同意。纳入标准:(1)经病理证实为成人弥漫性胶质瘤;(2)术前1周内进行了常规MRI及DTI检查;(3)临床及病理资料完整。排除标准:(1)MRI检查前已接受脑肿瘤相关治疗,排除32例;(2)MRI图像质量存在明显伪影或采集不完整,排除9例;(3)既往存在脑血管等神经系统疾病、系统性疾病或其他部位恶性肿瘤,排除14例。共排除55例,最终入组106例成人弥漫性胶质瘤,根据7∶3的比例随机分为训练数据集和测试数据集。

1.2 颅脑MR图像采集

       所有患者均在美国GE Signa PET/MR扫描仪(19通道头颈线圈)完成颅脑MR检查,扫描序列包括:T1WI、T2WI、T2液体衰减反转恢复(T2-weighted fluid attenuated inversion recovery, FLAIR)、扩散加权成像(diffusion-weighted imaging, DWI)、3D T1 BRAVO、3D T1 BRAVO+C增强扫描,常规序列扫描参数见表1。DTI扫描参数:TR 9232 ms,TE 97 ms,FOV 224 mm×224 mm,矩阵112×112,层厚3.5 mm,层间隔0 mm,b值分别为0、1000 s/mm2,扩散敏感梯度场施加在64个方向,扫描时间11 min 32 s。

表1  MRI常规扫描序列及参数
Tab. 1  parameters of conventional MRI sequences

1.3 常规磁共振视觉评价特征提取分析

       两名具有3年神经系统肿瘤诊断经验的放射科住院医师依据VASARI标准,在未知患者临床病理资料前提下,随机抽取入组的50例常规MR图像进行视觉特征分析,并对两位医师分析的结果进行组内一致性检验。再由另一位具有15年脑肿瘤诊断经验的放射科副主任医师对两人图像分析结果进行评价,对于每位医师符合VASARI标准的视觉特征项目记1分,不符合的视觉特征项目不计分,并计算两名医师总得分,选择得分最高的医生完成所有入组的数据分析,并对所有视觉评价结果进行监督及修改。

       25个VASARI特征是通过分析轴位T1WI、3D T1 BRAVO+C增强扫描、T2WI、T2-FLAIR以及 DWI序列共同完成,特征包括:肿瘤位置、肿瘤中心侧、重要脑功能区受累、强化程度、强化比例、非强化比例、坏死比例、囊变、多灶性、T1/FLAIR比例、水肿比例、强化边缘厚度、强化及非强化部分边界、出血、扩散、软脑膜及室管膜浸润、脑灰质及深部白质浸润、肿瘤各部分跨中线、颅骨重塑[7]

1.4 DTI图像后处理及特征提取

       对所有入组DTI图像应用GE AW 4.7工作站计算 FA、MD、RA及VR参数图。一名放射科住院医师(3年工作经验)在1名高年资副主任医师(15年工作经验)的监督和指导下,采用双盲法在T1 BRAVO+C图像上肿瘤实质最大层面选择强化最明显处(若强化不明显或无强化,则选择T2-FLAIR上肿瘤最大层面的实质等或高信号区域),避开坏死、囊变、钙化及出血区域选取5个大小形状相同的感兴趣区(region of interest, ROI)勾画(图1),ROI面积为20~40 mm2,分别测量5个ROI中FA、MD、RA、VR的最大值、最小值、平均值和中位数(minimum、maximum、mean、median)并取均值,得到肿瘤实性区域的FA-max、FA-min、FA-mean、FA-median、MD-max、MD-min、MD-mean、MD-median、RA-max、RA-min、RA-mean、RA-median、VR-max、VR-min、VR-mean、VR-median,并在肿瘤对侧半卵圆中心勾画相同数量ROI并测量相应数值,并将肿瘤区域数值除以对侧半卵圆中心相应数值以计算上述指标的FA相对值(relative FA, rFA)、MD相对值(relative MD, rMD)、RA相对值(relative RA, rRA)和VR相对值(relative VR, rVR)[10]

       采用3D Slicer软件(5.2.2版本,https://www.slicer.org)对肿瘤FA、MD、RA及VR的直方图特征提取,首先使用ANTs插件将T2-FLAIR、FA、MD、RA及VR图像与3D T1 BRAVO序列图像配准,然后在T2-FLAIR上手动勾画肿瘤及瘤周水肿作为感兴趣体积(volume of interest, VOI)(图2),并使用Pyradiomics工具箱从VOI中提取DTI直方图特征,提取的直方图特征包括:第10百分位数(10Percentile)、第90百分位数(90Percentile)、能量(Energy)、熵值(Entropy)、四分位数范围(Interquartile Range)、峰度(Kurtosis)、最大值(Maximum)、平均绝对偏差(Mean Absolute Deviation)、均值(Mean)、中位数(Median)、最小值(Minimum)、范围(Range)、鲁棒绝对平均偏差(Robust Mean Absolute Deviation)、均方根(Root Mean Squared)、偏度(Skewness)、总能量(Total Energy)、均匀性(Uniformity)、差异性(Variance)。勾画VOI过程由一名有3年工作经验的放射科住院医师进行,并在一名有15年工作经验的副主任医师监督下完成,2名医师均未知患者临床及病理信息,勾画观点不一致时,共同协商解决。

图1  肿瘤感兴趣区的勾画示意图。1A:对比增强后T1 BRAVO序列;1B:流体衰减反转恢复序列;1C:各向异性分数;1D:平均扩散率;1E:相对各向异性;1F:容积比各向异性。
Fig. 1  Schematic diagram of delineation of tumor regions of interest. 1A: post-contrast enhanced T1 BRAVO; 1B: fluid attenuation inversion recovery; 1C: fractional anisotropy; 1D: mean diffusivity; 1E: relative anisotropy; 1F: volume ratio anisotropy.
图2  肿瘤感兴趣体积的勾画示意图。2A:各向异性分数;2B:平均扩散率;2C:相对各向异性;2D:容积比各向异性。
Fig. 2  Schematic diagram of delineation of tumor volume of interest. 2A: fractional anisotropy; 2B: mean diffusivity; 2C: relative anisotropy; 2D: volume ratio anisotropy.

1.5 特征筛选及模型建立

       图3展示集成学习的特征筛选、模型建立及评价的框架流程。首先,采用Z-score标准化方法对DTI直方图特征进行标准化预处理,然后用RFE和Boruta算法进行VASARI、DTI临床参数及直方图特征进行梯度筛选,采用GNB算法构建VASARI、DTI临床参数及直方图特征的基础分类模型;最后,以SVM作为次级分类器采用堆叠泛化法方法进行集成式机器学习模型构建。

图3  集成学习框架示意图。DTI:扩散张量成像;VASARI:伦勃朗视觉感受图像;RFE:递归特征消除;GNB:高斯朴素贝叶斯;SVM:支持向量机;IDH:异柠檬酸脱氢酶;ROC:受试者工作特征;DCA:决策曲线分析。
Fig. 3  Schematic diagram of ensemble learning model. DTI: diffusion tensor imaging; VASARI: visually accessible Rembrandt images; RFE: recursive feature elimination; GNB: Gaussian Naive Bayes; SVM: support vector machine; IDH: isocitrate dehydrogenase. ROC: receiver operating characteristics; DCA: decision curve analysis.

1.6 统计学分析

       使用 SPSS 19(23.0.0 版本)进行统计分析,采用Kolmogorov-Smirnov方法检验训练集和测试集中胶质瘤患者的影像资料的正态性,符合正态分布的资料使用均数±标准差(x¯±s)表示;不符合正态分布的资料采用中位数(四分位数间距)表示。对定量资料采用独立样本 t检验或Wilcoxon秩和检验分析,对定性资料用卡方检验或Fisher's精确检验分析。采用Kappa检验评价两位医师对常规MRI视觉特征结果的一致性。所有的统计分析都将P<0.05 为差异具有统计学意义。绘制常规MRI视觉特征、DTI临床参数特征、DTI直方图特征及联合应用的集成学习模型的受试者工作特征(receiver operating characteristic, ROC)曲线并计算曲线下面积(area under the curve, AUC)值,评估其对胶质瘤IDH突变状态的诊断效能。

2 结果

2.1 一般临床病理信息的分布

       根据2021版WHO中枢神经系统肿瘤分类指南,结合病理组织学及分子信息将入组的106例胶质瘤(50.05±15.17岁,54例男性)划分为55例IDH突变型成人弥漫性胶质瘤与51例IDH野生型成人弥漫性胶质瘤,其中WHO 2级胶质瘤27例、WHO 3级胶质瘤15例、WHO 4级胶质瘤64例。按7∶3的比例随机分为训练集和测试集,74例训练集(49.19±14.25岁,36例男性)包括36例IDH野生型及38例IDH突变型;32例测试集(52.03±16.95岁,18例男性)包括15例IDH野生型及17例IDH突变型。入组患者的临床病理信息如表2所示,训练集和测试集患者的年龄、性别及肿瘤WHO级别差异无统计学意义(P值分别为0.381、0.472、0.939)。

表2  入组患者临床病理信息
Tab. 2  Clinical characteristics of the enrolled patients

2.2 VASARI特征一致性分析、特征筛选及组间差异

       两位医师对基于VASARI的常规MRI视觉评价特征进行提取时,表现出中等到强的一致性,其Kappa值范围为0.531~0.967。VASARI特征经RFE和Boruta梯度筛选,共有6个保留预测成人弥漫性胶质瘤IDH表型:肿瘤位置、坏死部分比例、环形强化厚度、水肿比例、皮质受累与否、肿瘤非强化部分是否跨中线(图4),这些特征在IDH突变型和野生型成人弥漫性胶质瘤之间差异有统计学意义(P<0.05)(表3),并且观察者一致性检验显示Kappa值均大于0.8(肿瘤位置:0.828,坏死部分比例:0.940,环形强化厚度:0.808,水肿比例:0.967,皮质受累与否:0.845,肿瘤非强化部分是否跨中线:0.944)。IDH突变型和野生型成人弥漫性胶质瘤的常规MRI典型表现见图5

图4  VASARI特征筛选过程示意图。4A为RFE特征筛选图,4B为Boruta特征筛选图。RFE:递归特征消除。
Fig. 4  Schematic diagram of features selection of VASARI features. 4A: features selection map of RFE, 4B: features selection map of Brouta. RFE: recursive feature elimination.
图5  IDH野生型及突变型成人弥漫性胶质瘤常规MRI视觉评价图。5A~5D、5E~5H分别为T1 BRAVO、T2WI、T2-FLAIR、对比增强后T1 BRAVO序列图像。5A~5D:女,50岁,IDH野生型成人弥漫性胶质瘤,右侧颞叶团块状长T1、长T2信号,增强扫描呈明显环形强化,强化环厚度≥3 mm,水肿比例为68%~95%、坏死比例<5%。5E~5H:男,35岁,IDH突变型,左侧额叶类圆形长T1、长T2信号,增强扫描未见强化,水肿比例为6%~33%、无坏死。IDH:异柠檬酸脱氢酶。
Fig. 5  Schematic diagram of conventional MRI of IDH wild-type and IDH mutant gliomas. 5A-5D and 5E-5H are T1 BRAVO, T2WI, T2-FLAIR, post-contrast enhanced T1 BRAVO, respectively. 5A-5D: A 50-year-old female patient, IDH wild-type, with long T1 and long T2 signals in the right temporal lobe, the tumor parenchyma show marked circular enhancement on enhanced scan, the thickness of enhancing margin ≥3 mm, 68%-95% proportion of edema, <5% proportion of necrosis. 5E-5H: A 35-year-old male patient, IDH mutant, left frontal lobe with circular long T1 and long T2 signals, and no enhancement on enhanced scans, 6%-33% proportion of edema, none proportion of necrosis. IDH: isocitrate dehydrogenase.
表3  IDH突变型与IDH野生型胶质瘤VASARI特征分析
Tab. 3  Analysis of VASARI features of IDH-mutant and IDH-wildtype gliomas

2.3 DTI临床参数筛选及组间差异

       8个DTI常规临床参数经过RFE和Boruta梯度筛选被保留作为模型预测因子:FA-mean、FA-median、VR-median、rVR-median、MD-min、MD-median、rMD-min及rMD-median(图6)。IDH野生型组胶质瘤实性区FA-mean、FA-median、VR-median、rVR-median高于IDH突变型组,差异具有统计学意义(P<0.05);IDH野生型组胶质瘤实性区MD-min、MD-median、rMD-min、rMD-median低于IDH突变型组,差异具有统计学意义(P<0.05)(表4)。IDH突变型和野生型的DTI参数表现见图7

图6  DTI临床参数特征筛选过程示意图。6A为RFE特征筛选图,6B为Boruta特征筛选图。RFE:递归特征消除。
Fig. 6  Schematic diagram of features selection of DTI clinical parameters features. 6A: features selection map of RFE, 6B: features selection map of Brouta. RFE: recursive feature elimination.
图7  IDH野生型胶质瘤和IDH突变型胶质瘤DTI参数(FA、MD、RA、VR)示意图。7A~7D、7E~7H分别为FA、MD、RA、VR参数图。7A~7D:女,50岁,IDH野生型。7E~7H:男,35岁,IDH突变型。IDH:异柠檬酸脱氢酶;DTI:扩散张量成像;FA:各向异性分数;MD:平均扩散率;RA:相对各向异性;VR:容积比各向异性。
Fig. 7  Schematic diagram of DTI parameters (FA, MD, RA, VR) of IDH wild-type and IDH mutant gliomas. 7A-7D and 7E-7H are the parameter diagrams for FA, MD, RA, and VR, respectively. 7A-7D: A 50-year-old female patient, IDH wild-type. 7E-7H: A 35-year-old male patient, IDH mutant. IDH: isocitrate dehydrogenase; DTI: diffusion tensor imaging; FA: anisotropy fraction; MD: mean diffusivity; RA: relative anisotropy; VR: volume ratio anisotropy.
表4  IDH突变型与IDH野生型胶质瘤DTI临床参数特征分析
Tab. 4  Analysis of DTI clinical parameters features of IDH-mutant and IDH-wildtype gliomas

2.4 DTI直方图特征筛选及组间差异

       IDH突变型组与IDH野生型组胶质瘤的DTI直方图特征中筛选出了8项:RA-Median、MD-Kurtosis、MD-Skewness、FA-Mean、FA-RootMeanSquared、VR-10Percentile、VR-90Percentile、VR-Median作为预测特征,特征筛选过程见图8。IDH野生型组胶质瘤MD-Kurtosis、MD-Skewness、RA-Median、FA-Mean、FA-RootMeanSquared、VR-10Percentile、VR-90Percentile、VR-Median高于IDH突变型组,差异具有统计学意义(P<0.05),详见表5

图8  DTI直方图特征筛选过程图。8A为RFE特征筛选图,8B为Boruta特征筛选图。RFE:递归特征消除。
Fig. 8  Schematic diagram of features selection of DTI histogram features. 8A: features selection map of RFE, 8B: features selection map of Brouta. RFE: recursive feature elimination.
表5  IDH突变型与IDH野生型胶质瘤DTI直方图特征分析
Tab. 5  Analysis of DTI histogram features of IDH-mutant and IDH-wildtype gliomas

2.5 模型性能评价

       ROC曲线分析发现相比于由常规MRI视觉特征、DTI临床参数及DTI直方图特征构建的三个基础模型,集成学习模型在区分IDH表型方面性能最好,在训练集和测试集中的AUC分别为0.92和0.89。三个基础分类器模型中,由DTI直方图特征构建的模型表现最好,在训练集和测试集中的AUC分别为0.90和0.87,DTI参数构建的模型在训练集和测试集的AUC分别为0.83和0.78,常规MRI视觉特征构建的模型在训练集和测试集的AUC分别为0.84和0.66(表6图9)。

图9  基于VASARI特征、DTI临床参数特征和DTI参数直方图特征构建的3个基础模型和集成学习模型在训练集(9A)和测试集(9B)的受试者工作特征曲线图。DTI:扩散张量成像;VASARI:伦勃朗视觉感受图像;AUC:受试者工作特征曲线下面积。
Fig. 9  The AUC diagrams of three base models and ensemble learning model based on VASARI, DTI clinical parameters features and DTI histogram features on the training set and test set. DTI: diffusion tensor imaging; VASARI: visually accessible Rembrandt images; AUC: area under the curve.
表 6  基础模型及集成学习模型的评估结果
Tab. 6  The evaluation results of the base models and the ensemble learning model

3 讨论

       本研究采用堆叠集成式算法将常规MRI视觉评价特征、DTI参数及直方图特征与GNB、SVM算法进行整合,建立了一个集成式的机器学习模型,用于术前预测成人弥漫性胶质瘤IDH基因状态并得到了良好的预测效能。本研究创新地构建了一种将多种机器学习算法集成的框架,该集成式算法在不同数据集中的适应能力更好,弥补了单一算法泛化能力不足的问题,并联合常规MRI序列和扩散张量成像序列的参数及直方图特征,更全面地定量反映胶质瘤异质性。研究结果表明通过使用客观可靠的联合MRI序列影像组学生物标志物所开发的集成模型,是一种术前无创预测IDH的新方法,对于临床制订个性化治疗方案方面具有一定的临床意义。

3.1 VASARI预测成人弥漫性胶质瘤IDH表型

       通过VASARI特征集进行成人弥漫性胶质瘤影像学特征的分析预测IDH基因突变,发现肿瘤位置、坏死部分比例、环形强化厚度、水肿比例、皮质受累、肿瘤非强化部分是否跨越中线是IDH基因突变的可用预测特征。本研究发现IDH突变型胶质瘤发生在额叶的比例更高,而IDH野生型胶质瘤更易发生在颞叶,这与之前的研究一致[15, 16]。本研究发现96.4%的IDH突变型胶质瘤出现皮层下受累,而84.3%的IDH野生型累及灰质。SAHU等[17]的研究也发现94.7% IDH突变型胶质瘤累及皮质,72.9%的IDH野生型胶质瘤累及皮质,可能是因为IDH野生型胶质瘤主要侵及脑深部白质,从而对于皮质的累及比例低于IDH突变型。其他研究也发现IDH野生型胶质瘤较IDH突变型更易出现坏死、水肿比例更大,可能与IDH野生型胶质瘤恶性程度高、生长速度快而易出现坏死区域、瘤周浸润更加显著有关[18]。此外,本研究发现不同IDH状态胶质瘤组间,非强化区是否跨中线为预测特征之一,45.1%的IDH野生型肿瘤不存在非强化区成分,而IDH突变型肿瘤中这一比例仅约16.3%,意味着IDH突变型肿瘤更易出现非强化区成分。有研究发现非强化部分的存在是2~3级胶质瘤预后的独立预测因素,肿瘤存在非强化成分时预后较好[19]。CARRILLO等[20]认为IDH突变型胶质瘤的大面积非强化成分可能较低的血管内皮生长因子水平导致的。本研究发现41.2%的IDH野生型胶质瘤出现边缘环形强化,何金龙等[21]利用常规磁共振影像学特征联合影像组学特征预测胶质瘤IDH状态的研究同样发现IDH野生型胶质瘤约42.9%出现环形强化。但SAHU等[17]的研究中IDH野生型胶质瘤约80.6%出现边缘环形强化,原因可能在于该研究纳入胶质瘤队列构成与之前的研究不同,该研究仅纳入4级胶质瘤,没有纳入2级或3级胶质瘤。

       预测模型性能方面本研究显示VASARI特征集的诊断效能 AUC 值在为训练集和测试集分别为0.84、0.66。但其他研究应用VASARI特征预测胶质瘤IDH基因的结果存在差异,ZHOU等[19]的研究中纳入了165例2、3级胶质瘤患者,经logistic回归纳入坏死比例和肿瘤大小特征构建的模型AUC为0.73。VERDUIN等[22]的研究中,纳入了72例胶质母细胞瘤,经logistic回归筛选出10项VASARI特征,并基于极限梯度提升算法构建模型,测试集中AUC为0.747,内部验证集中AUC为0.684,其中重要脑功能区受累、非强化比例、强化边界及T1/FLAIR比例特征在我们的研究中并未作为预测特征进行模型构建,可能原因在于特征筛选方法不同,此外该研究聚焦于胶质母细胞瘤而我们的研究专注于成人弥漫性胶质瘤,两项研究纳入队列的构成也不同。

3.2 DTI参数预测成人弥漫性胶质瘤IDH表型

       DTI反映胶质瘤内水分子向各个方向的扩散受限程度,即各向异性扩散,从而间接反映肿瘤细胞密度及异质性,为预测胶质瘤IDH突变提供水分子扩散异常定量信息[23]。先前研究发现在胶质瘤实性区域中,与IDH野生型组相比,IDH突变型组的MD值显著大于IDH野生型组,IDH突变型组的FA值显著低于IDH野生型胶质瘤[24],本研究的结果是与之相符的,可能是因为IDH突变会导致乏氧诱导因子激活减少,从而下游抑制血管生成及相关信号传导,以及IDH野生型胶质瘤更大的肿瘤细胞密度造成了水分子扩散的各向异性程度上升且扩散受限[25]。既往研究已将整体肿瘤区域的DTI直方图特征用于预测胶质瘤IDH状态,并取得了一定的结果。HUANG等[26]在一项小样本研究中构建了基于肿瘤整体区域FA和MD直方图特征的模型并进行了自举重采样验证,发现多种直方图特征如平均值、第25百分位数、第75百分位数和偏度可以预测IDH状态,单一参数特征中FA的第25百分位数其AUC表现最高为0.87,将参数联合应用后模型AUC达到了0.93,模型诊断效能虽然高于我们的模型,但该研究仅纳入了40例患者,且局限于岛叶胶质瘤,对于其他部位胶质瘤基因表现的预测表现未进行探索。国内学者GAO等[11]在一项前瞻性研究中,探索了多种扩散模型参数(DTI、扩散峰度成像、神经突方向离散度与密度成像等)的预测胶质瘤IDH状态表现,在DTI参数模型方面基于logistic回归纳入了FA均方根特征与MD均方根特征的联合模型预测IDH状态的AUC为0.76,但是没有使用采用机器学习方法分析。PARK等[27]利用常规磁共振影像组学特征和DTI的MD、FA参数直方图特征,基于随机森林算法建模并进行了10折交叉验证,加入了DTI参数特征后,使模型AUC从单独使用常规组学特征的0.835提高到了0.869,实现了更加精准的分类,但在模型构建方面没有对比其他机器学习方法的性能表现,且AUC略低于本研究。

3.3 联合常规MRI视觉特征与DTI预测成人弥漫性胶质瘤IDH表型

       目前联合常规MRI视觉特征与DTI定量参数预测胶质瘤IDH表型的报道较少,XIONG等[24]的研究中初步探索了结合常规视觉特征与DTI参数预测胶质瘤IDH表型的效果,经logistic回归将肿瘤位置、强化程度的视觉特征与肿瘤实性区域的FA、MD值联合应用后模型预测的敏感度、特异度分别从单独使用视觉特征的59.7%、52.9%提高到了92.2%、75.8%。此外,机器学习算法已在改善胶质瘤鉴别诊断、术前预测分级及分子分型、预后评估甚至在预测药物的抗胶质瘤活性方面都展现出广泛的应用[28, 30, 31]。一项荟萃分析[32]显示目前机器学习方法预测胶质瘤IDH状态的AUC值约0.75~0.99,其中以使用3D Dense-UNet构建的模型表现最佳,证明了机器学习在胶质瘤分子特征分类方面应用的价值。但目前的研究方法多为筛选出多模态特征后再应用单独一种机器学习方法建模,而本研究应用了堆叠泛化的方法将基础分类器进行级联整合建立集成学习模型,实现了常规MRI特征及DTI直方图特征的泛化融合,在预测成人弥漫性胶质瘤IDH突变的准确性及鲁棒性均较高(AUC=0.89),较以往PARK等[27]单独使用DTI参数特征的机器学习模型表现更好(AUC=0.79)。相比于单独使用某一种机器学习方法或单一功能磁共振序列,联合常规磁共振特征与DTI直方图参数特征,最大化利用多种序列带来的不同维度信息,证明了常规MRI特征及DTI特征的集成模型的有效性,以及其在术前预测成人弥漫性胶质瘤IDH状态的应用前景。

3.4 局限性与展望

       首先,本研究预测聚焦于2021版WHO的中枢神经系统肿瘤分类,纳入患者均进行了分子病理学综合诊断,具有高质量的分级分类,但由于新版成人弥漫性胶质瘤分类依靠分子病理诊断的难度较大,因此数据来源于单一中心且样本量相对较少,下一步需要外部数据扩充样本量并在更大患者队列中验证模型的性能。其次,手动分割胶质瘤的整体肿瘤区域是肿瘤分割的常用方法,也是自动分割研究的金标准,但大量的数据耗时费力,未来的研究应该进一步探索可靠的智能化肿瘤分割方法。最后,由于本研究纳入的符合新版分类的成人弥漫性胶质瘤分子诊断的患者入组时间较短,部分患者未能随访至终点事件,未来需要与患者预后生存期进行相关分析验证模型评估预后的效能。

4 结论

       本研究开发的基于堆叠泛化的集成式机器学习模型将常规MRI的VASARI特征与DTI参数实现低冗余高效能的整合,集成模型可以有效而稳健地预测成人弥漫性胶质瘤IDH基因表型的状态,有助于临床医生智能化快速评估成人弥漫性胶质瘤患者预后,调整个体化的治疗方案。

[1]
MILLER K D, OSTROM Q T, KRUCHKO C, et al. Brain and other central nervous system tumor statistics, 2021[J]. CA: Cancer J Clin, 2021, 71(5): 381-406. DOI: 10.3322/caac.21693.
[2]
OSTROM Q T, CIOFFI G, WAITE K, et al. CBTRUS Statistical Report: Primary Brain and Other Central Nervous System Tumors Diagnosed in the United States in 2014–2018[J]. Neuro Oncol, 2021, 23(Supplement_3): iii1-iii105. DOI: 10.1093/neuonc/noab200.
[3]
LOUIS D N, PERRY A, WESSELING P, et al. The 2021 WHO Classification of Tumors of the Central Nervous System: a summary[J]. Neuro Oncol, 2021, 23(8): 1231-1251. DOI: 10.1093/neuonc/noab106.
[4]
WONG Q H W, LI K K W, WANG W W, et al. Molecular landscape of IDH-mutant primary astrocytoma grade Ⅳ/glioblastomas[J]. Mod Pathol, 2021, 34(7): 1245-1260. DOI: 10.1038/s41379-021-00778-x.
[5]
YOUSSEF G, MILLER J J. Lower grade gliomas[J/OL]. Curr Neurol Neurosci Rep, 2020, 20(7): 21 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC7244462/. DOI: 10.1007/s11910-020-01040-8.
[6]
YOU W, MAO Y, JIAO X, et al. The combination of radiomics features and VASARI standard to predict glioma grade[J/OL]. Front Oncol, 2023, 13: 1083216 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC10073533/. DOI: 10.3389/fonc.2023.1083216.
[7]
SETYAWAN N H, CHORIDAH L, NUGROHO H A, et al. Beyond invasive biopsies: using VASARI MRI features to predict grade and molecular parameters in gliomas[J/OL]. Cancer Imaging, 2024, 24(1): 3 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC10759759/. DOI: 10.1186/s40644-023-00638-8.
[8]
KURT N, BINBOGA KURT B, GULSARAN U, et al. Diffusion tensor imaging and diffusion-weighted imaging on axillary lymph node status in breast cancer patients[J]. Diagn Interv Radiol, 2022, 28(4): 329-336. DOI: 10.5152/dir.2022.21460.
[9]
HALILIBRAHIMOĞLU H, POLAT K, KESKIN S, et al. Associating IDH and TERT mutations in glioma with diffusion anisotropy in normal-appearing white matter[J]. Am J Neuroradiol, 2023, 44(5): 553-561. DOI: 10.3174/ajnr.A7855.
[10]
AUGELLI R, CICERI E, GHIMENTON C, et al. Magnetic resonance diffusion-tensor imaging metrics in high grade gliomas: Correlation with IDH1 gene status in WHO 2016 era[J]. Eur J Radiol, 2019, 116: 174-179. DOI: 10.1016/j.ejrad.2019.04.020.
[11]
GAO A, ZHANG H, YAN X, et al. Whole-tumor histogram analysis of multiple diffusion metrics for glioma genotyping[J]. Radiology, 2022, 302(3): 652-661. DOI: 10.1148/radiol.210820.
[12]
ALIOTTA E, NOURZADEH H, BATCHALA P P, et al. Molecular subtype classification in lower-grade glioma with accelerated DTI[J]. AJNR Am J Neuroradiol, 2019, 40(9): 1458-1463. DOI: 10.3174/ajnr.A6162.
[13]
LIN K, CIDAN W, QI Y, et al. Glioma grading prediction using multiparametric magnetic resonance imaging-based radiomics combined with proton magnetic resonance spectroscopy and diffusion tensor imaging[J]. Med Phys, 2022, 49(7): 4419-4429. DOI: 10.1002/mp.15648.
[14]
YAN J, ZHAO Y, CHEN Y, et al. Deep learning features from diffusion tensor imaging improve glioma stratification and identify risk groups with distinct molecular pathway activities[J/OL]. EBioMedicine, 2021, 72: 103583 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC8479635/ DOI: 10.1016/j.ebiom.2021.103583.
[15]
张萌, 耿瑞雯, 白源, 等. 动脉自旋标记和扩散张量成像评估脑胶质瘤IDH1基因表型的价值研究[J]. 磁共振成像, 2023, 14(10): 58-64. DOI: 10.12015/issn.1674-8034.2023.10.011.
ZHANG M, GENG R W, BAI Y, et al. Value of arterial spin labeling and diffusion tensor imaging in evaluating IDH1 gene phenotype in gliomas[J]. Chin J Magn Reson Imaging, 2023, 14(10): 58-64. DOI: 10.12015/issn.1674-8034.2023.10.011.
[16]
HYARE H, RICE L, THUST S, et al. Modelling MR and clinical features in grade Ⅱ/Ⅲ astrocytomas to predict IDH mutation status[J]. Eur J Radiol, 2019, 114: 120-127. DOI: 10.1016/j.ejrad.2019.03.003.
[17]
SAHU A, PATNAM N G, GODA J S, et al. Multiparametric magnetic resonance imaging correlates of isocitrate dehydrogenase mutation in WHO high-grade astrocytomas[J/OL]. J Pers Med, 2022, 13(1): 72 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC9865247/. DOI: 10.3390/jpm13010072.
[18]
EISENBARTH D, WANG Y A. Glioblastoma heterogeneity at single cell resolution[J]. Oncogene, 2023, 42(27): 2155-2165. DOI: 10.1038/s41388-023-02738-y.
[19]
ZHOU H, VALLIÈRES M, BAI H X, et al. MRI features predict survival and molecular markers in diffuse lower-grade gliomas[J]. Neuro Oncol, 2017, 19(6): 862-870. DOI: 10.1093/neuonc/now256.
[20]
CARRILLO J A, LAI A, NGHIEMPHU P L, et al. Relationship between tumor enhancement, edema, IDH1 mutational status, MGMT promoter methylation, and survival in glioblastoma[J]. AJNR Am J Neuroradiol, 2012, 33(7): 1349-1355. DOI: 10.3174/ajnr.A2950.
[21]
何金龙, 高阳, 吴琼, 等. 多序列影像组学结合临床及影像学特征预测脑胶质瘤IDH1基因突变[J]. 磁共振成像, 2023, 14(8): 27-33, 134. DOI: 10.12015/issn.1674-8034.2021.06.017.
HE J L, GAO Y, WU Q, et al. Predicting IDH1 gene mutation of gliomas by combining clinical and imaging features with multiple sequence radiomics[J]. Chin J Magn Reson Imaging, 2023, 14(8): 27-33. DOI: 10.12015/issn.1674-8034.2021.06.017.
[22]
VERDUIN M, PRIMAKOV S, COMPTER I, et al. Prognostic and predictive value of integrated qualitative and quantitative magnetic resonance imaging analysis in glioblastoma[J/OL]. Cancers, 2021, 13(4): 722 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC7916478/. DOI: 10.3390/cancers13040722.
[23]
LI Y, ZHANG W. Quantitative evaluation of diffusion tensor imaging for clinical management of glioma[J]. Neurosurg Rev, 2020, 43(3): 881-891. DOI: 10.1007/s10143-018-1050-1.
[24]
XIONG J, TAN W, WEN J, et al. Combination of diffusion tensor imaging and conventional MRI correlates with isocitrate dehydrogenase 1/2 mutations but not 1p/19q genotyping in oligodendroglial tumours[J]. Eur Radiol, 2016, 26(6): 1705-1715. DOI: 10.1007/s00330-015-4025-4.
[25]
KICKINGEREDER P, SAHM F, RADBRUCH A, et al. IDH mutation status is associated with a distinct hypoxia/angiogenesis transcriptome signature which is non-invasively predictable with rCBV imaging in human glioma[J/OL]. Sci Rep, 2015, 5(1): 16238 [2024-06-09]. https://pubmed.ncbi.nlm.nih.gov/26538165/. DOI: 10.1038/srep16238.
[26]
HUANG Z, LU C, LI G, et al. Prediction of lower grade insular glioma molecular pathology using diffusion tensor imaging metric-based histogram parameters[J/OL]. Front Oncol, 2021, 11: 627202 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC7988075/. DOI: 10.3389/fonc.2021.627202.
[27]
PARK C J, CHOI Y S, PARK Y W, et al. Diffusion tensor imaging radiomics in lower-grade glioma: improving subtyping of isocitrate dehydrogenase mutation status[J]. Neuroradiology, 2020, 62(3): 319-326. DOI: 10.1007/s00234-019-02312-y.
[28]
QIAN Z, LI Y, WANG Y, et al. Differentiation of glioblastoma from solitary brain metastases using radiomic machine-learning classifiers[J]. Cancer Lett, 2019, 451: 128-135. DOI: 10.1016/j.canlet.2019.02.054.
[29]
KIM M, JUNG S Y, PARK J E, et al. Diffusion- and perfusion-weighted MRI radiomics model may predict isocitrate dehydrogenase (IDH) mutation and tumor aggressiveness in diffuse lower grade glioma[J]. Eur Radiol, 2020, 30(4): 2142-2151. DOI: 10.1007/s00330-019-06548-3.
[30]
TAN Y, MU W, WANG X C, et al. Improving survival prediction of high-grade glioma via machine learning techniques based on MRI radiomic, genetic and clinical risk factors[J/OL]. Eur J Radiol, 2019, 120: 108609 [2024-06-09]. https://pubmed.ncbi.nlm.nih.gov/31606714/. DOI: 10.1016/j.ejrad.2019.07.010.
[31]
NEVES B J, AGNES J P, GOMES M D N, et al. Efficient identification of novel anti-glioma lead compounds by machine learning models[J/OL]. Eur J Med Chem, 2020, 189: 111981 [2024-06-09]. https://pubmed.ncbi.nlm.nih.gov/31978780/. DOI: 10.1016/j.ejmech.2019.111981.
[32]
VAN KEMPEN E J, POST M, MANNIL M, et al. Accuracy of machine learning algorithms for the classification of molecular features of gliomas on MRI: A systematic literature review and meta-analysis[J/OL]. Cancers, 2021, 13(11): 2606 [2024-06-09]. https://pmc.ncbi.nlm.nih.gov/articles/PMC8198025/. DOI: 10.3390/cancers13112606.

上一篇 扩散峰度成像对遗尿症男童脑白质微结构改变的研究
下一篇 合成MRI联合酰胺质子转移成像在预测脑胶质瘤IDH1基因状态中的应用价值
  
诚聘英才 | 广告合作 | 免责声明 | 版权声明
联系电话:010-67113815
京ICP备19028836号-2