分享:
分享到微信朋友圈
X
已于2022-08-10撤稿
技术研究
基于常规MRI图像的不同影像组学模型在脑胶质瘤术前分级中的应用
穆建华 张雁伟 吴志钢

Cite this article as: Mu JH, Zhang YW, Wu ZG. Application of different radiomics dignostic models based on conventional MR images in the preprotive grading of brain glioma. Chin J Magn Reson Imaging, 2020, 11(1): 55-59.本文引用格式:穆建华,张雁伟,吴志钢.基于常规MRI图像的不同影像组学模型在脑胶质瘤术前分级中的应用.磁共振成像, 2020, 11(1): 55-59. DOI:10.12015/issn.1674-8034.2020.01.012.


[摘要] 目的 拟采用不同核磁共振图像、不同机器学习模型来建立胶质瘤术前分级的影像组学模型,探究影像组学模型在胶质瘤术前分级中的可行性。材料与方法 回顾性分析术前行常规MRI检查的脑胶质瘤患者93例,分为低级别胶质瘤(LGG组)和高级别胶质瘤(HGG组)。将DICOM格式图像导入GE-AK软件,对T2WI和T1增强(T1CE)图像进行感兴趣区(region of interest,ROI)勾画,将提取得到的直方图特征和纹理特征导入R语言软件包进行特征预处理和降维,选择三种函数建立六种机器学习模型,将全部数据按照7︰3比例,分为训练集与测试集,利用10倍交叉验证对六种模型进行训练,然后通过测试集进行验证,并绘制ROC曲线,计算其分类LGG与HGG的敏感度、特异度、AUC。结果 LGG组平均年龄低于HGG组,差异有统计学意义(P <0.01)。LGG组与HGG组性别组成差异无统计学意义(P>0.05)。六种影像组学模型的AUC值均大于0.8,基于T1CE图像的影像组学模型的AUC值均大于基于T2WI图像模型的AUC,其中基于T1CE图像的RF模型的AUC最高,达到0.97。结论 影像组学诊断模型对胶质瘤的病理分级具有较好的诊断价值,六种影像组学模型的诊断效能均较高,其中基于T1CE图像的RF模型诊断效能最高。
[Abstract] Objective: This study intends to use different MR images and different machine learning models to establish a radiomics diagnostic model of preoperative grading of gliomas, exploring the feasibility of radiomics diagnostic models in preoperative grading of gliomas.Materials and Methods: This study retrospectively analyzed 93 patients with glioma who underwent routine MRI examination before operation. They were divided into low-grade glioma (LGG group) and high-grade glioma (HGG group). DICOM format images were imported into GE-AK software. The regions of interest (ROI) of T2-weighted (T2WI) and T1-enhanced (T1CE) images were delineated by software features extraction. Histogram and texture features were imported into R language software package for feature preprocessing and dimensionality reduction. Then six machine learning models were established by selecting three functions. All the data were divided into training sets and training sets according to the ratio of 7∶3. The six models were trained by 10-fold cross-validation, and then the ROC curve was drawn to calculate the sensitivity, specificity and AUC of the classification of LGG and HGG.Results: The average age of LGG group was lower than that of HGG group (P<0.01). There was no significant difference in gender composition between LGG group and HGG group (P>0.05). The AUC of the six radiomics diagnostic models is greater than 0.8. The AUC of the radiomics diagnostic model based on T1 enhancement image is larger than that based on T2WI image, and the AUC of the RF model based on T1 enhancement image is the highest, reaching 0.97.Conclusions: The diagnostic model of imaging histology has good diagnostic value for the pathological grading of glioma. The diagnostic efficiency of six imaging histology models is higher, and the RF model based on T1CE image has the highest diagnostic efficiency.
[关键词] 影像组学;胶质瘤;病理分级;机器学习
[Keywords] radiomics;glioma;pathological grading;machine learning

穆建华 北京积水潭医院放射科,北京 100035

张雁伟 北京积水潭医院放射科,北京 100035

吴志钢* 北京积水潭医院放射科,北京 100035

通信作者:吴志钢,E-mail: huaqingliw@163.com

利益冲突:无。


收稿日期:2019-09-05
接受日期:2019-11-21
中图分类号:R445.2; R739.41 
文献标识码:A
DOI: 10.12015/issn.1674-8034.2020.01.012
本文引用格式:穆建华,张雁伟,吴志钢.基于常规MRI图像的不同影像组学模型在脑胶质瘤术前分级中的应用.磁共振成像, 2020, 11(1): 55-59. DOI:10.12015/issn.1674-8034.2020.01.012.

       脑胶质瘤是最常见的原发性脑肿瘤,约占恶性脑肿瘤的80%[1]。依据2007年世界卫生组织(WHO)中枢神经系统肿瘤分类和分级将其分为Ⅰ~Ⅳ级,其中Ⅰ~Ⅱ级统称为低级别胶质瘤(low-grade glioma,LGG) ,Ⅲ~Ⅳ级统称为高级别胶质瘤(high-grade glioma,HGG)[2]。LGG中部分肿瘤生物学行为呈良性,部分为良恶交界性肿瘤,治疗方式通常以手术切除为主。但部分研究发现Ⅱ级少突胶质细胞瘤对放化疗非常敏感,其手术切除后治疗效果并不理想,放化疗的治疗效果优于手术治疗[3],因此准确的术前胶质瘤分级可避免不必要的手术治疗。HGG通常分化不良,肿瘤呈高度异质性,生长方式多为弥漫浸润性生长。HGG患者在手术切除肿瘤后仍需进行辅助化疗或放射治疗,但预后仍不佳,且HGG极易复发。由此可见不同的病理级别是胶质瘤患者临床治疗方式及生存预后的主要影响因素。

       目前对胶质瘤术前分级的金标准是立体定向活检,该技术获取的肿瘤样本较小,易产生抽样误差,同时反复活检不仅有创,而且不符合医学伦理标准,不适用于肿瘤的长期监测和随访[4]。常规核磁共振(magnetic resonance imaging,MRI)检查具有无创性,其图像可反映肿瘤整体信息,目前在胶质瘤术前临床诊断中应用较多。但MRI不能完全反映肿瘤的生理与病理特征,而且受主观及经验因素影响较大,分级诊断准确性不高[5]。影像组学将传统影像诊断中的主观、半定量描述如强化程度、水肿范围、占位效应等转化为客观、定量参数如直方图特征、纹理特征等,这些定量特征即影像组学特征,通常包含着许多肉眼不可见的肿瘤生物学信息,如肿瘤的异质性、血管生成特性、浸润性与转移性等。影像组学模型的高准确性是影像组学能否成功应用于临床的关键,其中不同影像图像和不同机器学习模型对影像组学模型的诊断效能均有影响。

       不同MRI图像、不同机器学习模型的正确选择是筛选和建立有效影像组学模型的关键步骤;目前在运用影像组学进行胶质瘤术前分级的研究中,比较不同图像和机器学习模型诊断效能差异的研究较少,因此本研究拟采用不同MRI图像、不同机器学习模型来建立胶质瘤术前分级的影像组学模型,探究影像组学模型在胶质瘤术前分级中的可行性。

1 材料与方法

1.1 研究对象

       回顾性分析北京积水潭医院2015年1月至2018年4月术前行常规MRI检查的脑胶质瘤患者93例:LGG共23例,包括Ⅰ级胶质瘤1例,Ⅱ级胶质瘤22例,其中男15例,女8例,年龄范围14~65岁;HGG共70例,包括Ⅲ级胶质瘤28例,Ⅳ级胶质瘤42例,其中男25例,女35例,年龄范围32~68岁。

       入选标准:经手术后病理(WHO 2007年中枢神经系统肿瘤分类)确诊的Ⅰ~Ⅳ级胶质瘤患者;术前未行放化疗治疗;术前1周内接受过常规颅脑MRI检查。

       排除标准:图像质量不佳,无法满足软件后处理要求的患者;脑胶质瘤复发患者;手术前接受穿刺活检的患者。

1.2 仪器与方法

1.2.1 设备类型及线圈

       采用Simens 1.5 T (Magnetom Essenza,Siemens,Germany)核磁共振扫描系统,8通道正交头部线圈进行扫描。

1.2.2 体位及扫描范围

       仰卧位,头部先进,身体与床体保持一致,以冠状位和矢状位作为参考定位。在冠状位上定位线平行于两侧颞叶底部的连线;矢状面上平行于前后联合的连线或与胼胝体的前后连线平行。扫描范围由后颅窝底到颅顶。

1.2.3 扫描序列和参数

       所有患者行头颅轴位常规MRI序列扫描,其中包括DWI序列、ADC序列、T1WI序列、T2WI序列、FLAIR序列、矢状位T1WI序列扫描,后给予静脉团注对比剂Gd-DTPA (0.1 mmol/kg,流率2~4 mL/s),继以等量生理盐水快速团注行T1WI轴位、冠状位和矢状位增强扫描。具体扫描参数如下:T1WI:重复时间(TR) 400 ms,回波时间(TE) 10 ms,层厚5 mm,层间距1 mm,矩阵320×320,FOV 230 mm×230 mm;T2WI: TR 5090 ms,TE 91 ms,层厚5 mm,层间距1 mm,矩阵384×384,FOV 230 mm×230 mm。MRI扫描图像通过影像存档与通信系统(PACS)以DICOM格式导出。

1.3 图像分析与处理

1.3.1 感兴趣区的勾画和影像组学特征提取

       本研究分别选取T1增强(T1CE)图像和T2WI图像进行ROI勾画,将术前MRI图像导入GE-AK分析软件,在勾画ROI前对所有图像进行灰度和对比度调整,从而减小亮度和对比度变化对ROI勾画的影响。2名高年资神经影像诊断医师采用双盲法勾画ROI,如有意见不一致时,需经二者协商一致达成共识。ROI的大小取决于肿瘤大小,首先在T1CE图像勾画ROI,勾画时同时参考T1WI、T2WI、FLAIR图像,以区分肿瘤组成成分,然后以T1CE图像的ROI为标准,T2WI的ROI尽量与T1CE保持一致。软件经过自动计算得到基于T1CE图像的影像组学特征232个,其中直方图特征42个,灰度共生矩阵(GLCM)特征96个和灰度游程长度矩阵(GLRLM)特征94个;基于T2WI图像的影像组学特征232个,特征数目和名称与T1CE图像的影像组学特征相同。具体特征分类及名称详见表1

表1  纹理特征类型及详细分类
Tab. 1  Texture feature types and detailed classification

1.3.2 影像组学特征的选择和降维

       首先将获得的T2WI和T1CE图像的影像组学特征参数全部导入R语言(版本3.5.2)软件包,首先对数据集进行分组标记,LGG组标记为“0”,HGG组标记为“1”;然后采用标准化方法处理数据集中所有的特征变量,对缺失值进行填充,对极大值和极小值进行平衡处理,使得每个变量都有相同的量纲,选取“Princomp”函数,即通过主成分分析法(PCA)对数据进行降维处理,将T2WI和T1CE图像的影像组学特征数目分别降到20和22维,以消除冗余特征并减小数据过拟合对模型造成的影响。

1.3.3 机器学习模型的建立与验证

       使用R语言软件包中的caret,将降维后的特征数据导入,选取“Support Vector Machines with Linear Kernel”、“Random Forest”、“Logistic Regression”三种函数,基于TICE和T2WI图像分别建立SVM、RF、Logistic回归三种机器学习模型,将全部数据按照7︰3比例,分为训练集与测试集,其中训练集64例(HGG 48例,LGG 16例),测试集28例(其中HGG 21例,LGG 7例),利用10倍交叉验证对6种模型进行验证,“predict”函数计算其分类LGG与HGG的敏感度、特异度,通过pROC包绘制受试者工作特征(receiver operating characteristic curve ,ROC)曲线,并计算AUC。

1.4 统计学方法

       采用SPSS 22.0软件进行统计分析,正态分布计量资料以(±s)表示,组间比较采用t检验和χ2检验,以P< 0.05为差异有统计学意义;影像组学部分采用R语言进行分析,通过“Princomp”函数进行特征选择,caret包进行影像组学模型建立与验证,pROC包绘制ROC曲线并计算AUC ,“predict”函数计算敏感度、特异度。AUC为0.5~ 0.7时模型诊断价值较低,0.7~ 0.9时模型诊断价值中等,>0.9时模型诊断价值较高。

2 结果

2.1 一般临床资料统计学分析

       LGG组平均年龄低于HGG组,差异有统计学意义(P<0.01)。LGG组与HGG组性别组成差异无统计学意义(P>0.05)(表2)。

表2  一般临床资料分析
Tab. 2  Analysis of general clinical data

2.2 不同机器学习模型的诊断效能

       经特征选择后,T2WI图像获得影像组学特征20个,其中直方图特征7个,GLCM特征12个,GLRLM特征1个;T1CE图像获得影像组学特征22个,其中直方图4个特征,GLCM特征16个,GLRLM特征2个。pROC包绘制的ROC曲线见图1图2。在对不同影像组学学习模型进行训练与交叉验证后,分别得到六种影像组学模型的灵敏度、特异度与AUC,具体数值见表3

图1  基于T2WI图像三种机器学习模型的ROC曲线
图2  基于T1CE图像的三种机器学习模型的ROC曲线
Fig. 1  ROC curves based on three machine learning models of T2WI images.
Fig. 2  ROC curves based on three machine learning models of TICE images.
表3  三种机器学习诊断模型训练集的灵敏度、特异度与AUC
Tab. 3  Sensitivity, specificity and AUC of training sets of three machine learning diagnostic models

3 讨论

       影像组学利用术前既得的影像图像,提取潜在的影像组学参数,在胶质瘤的诊断、治疗、预后中得到了广泛应用,而且均表现出了较高的诊断效能。Yang等[6]通过RF模型对胶质母细胞瘤的分子亚型进行了分类,最高AUC达到0.82 ;Li等[7]通过Logistic回归模型对LGG中表皮生长因子受体分子表达状态进行预测,验证组中AUC达到0.95。本研究中六种影像组学诊断模型的AUC均大于0.8,提示诊断效能较高,验证了影像组学模型在胶质瘤术前分级的准确性,这与Tian等[8]研究结果一致;但所有的模型灵敏度相对较高,特异性较低,这可能是因高低级别胶质瘤发病率差异导致数据样本量的不平衡所造成的,未来可以通过平衡样本量的训练方法对模型进行训练来克服此种差异。本研究结果显示,在相同MRI图像的基础上,不同机器学习模型的诊断效能不同,其中基于T1CE图像的RF模型的AUC最高,达到0.97。RF是一种基于Bagging和随机子空间技术的机器学习模型,它由多个分类回归树(CART)组成,通过投票来决定最优分类结果,目前已有研究证明RF模型具有更加准确的分类效果和更少的过拟合,同时具有平衡误差和多类泛化能力[9]。Parmar等[10]利用14种特征选择方法和12种机器学习模型的不同组合来预测非小细胞肺癌患者的总体存活率,结果发现大多数特征选择方法与RF模型组合时,诊断预测效能均高于与其他模型组合的情况,其中Wilcoxon检验特征选择法和RF机器选择模型的组合分类方法具有最高的诊断效能(AUC=0.66±0.03)和最高的稳定性;Montazeri等[11]在对乳腺癌的预后研究中也发现,RF模型是具有最高准确度的模型,AUC达到0.93,这提示不同的机器学习模型对模型的诊断效能有影响;本研究证明在胶质瘤分级研究中,不同机器学习模型方法同样会对分级诊断效能产生影响,基于T2WI和T1CE图像的RF模型的诊断效能均高于其他诊断模型。

       在研究中我们观察到对于同一机器学习模型,T1CE图像的影像组学诊断模型的诊断效能优于T2WI模型,Qin等[12]的研究也证实了这一特点,这可能是因为T1CE图像由于对比剂的注入,凸显了不同的肿瘤成分,如坏死、囊变、出血等,因而包含更多肿瘤异质性信息,提高了模型鉴别LGG与HGG的诊断效能。

       在筛选影像组学特征中可发现直方图特征和GLCM特征所占比例较大。在T1CE图像降维后的纹理特征中,直方图特征有4个,GLCM特征16个,T2WI图像中直方图特征7个,GLCM特征12个,均占降维后总特征数量的90%以上,这与既往大多数研究一致[13,14]。可能是GLCM特征选取比例较大的原因,还可能因为直方图特征和GLCM特征包含的肿瘤生物学信息较多有关。Ryu等[14]在对直方图特征、GLCM特征、GLRLM特征的比较中发现,GLCM特征中的熵在鉴别LGG与HGG、Ⅲ级与Ⅳ级胶质瘤中均表现出良好的诊断效能(AUC分别为0.83和0.94),优于其直方图参数和GLRLM特征;同时Qin等[12]研究发现entropy与胶质瘤细胞的胶质细胞原纤维酸性蛋白(glial fibillary acidic protein,GFAP)表达呈显著相关,GFAP的表达是胶质细胞的特异性标志,其与胶质瘤的恶性程度相关,GFAP的表达程度降低,肿瘤的恶性程度增加,进而说明entropy可以反映肿瘤的恶性程度。尽管如此,本研究中大多数影像组学特征的生物学意义还没有被完全阐释,未来需要进行更多影像组学特征与肿瘤生物学信息相关性的研究,从而揭示影像组学特征的潜在和完整意义。

       本研究中采用PCA降维法对高维度的影像组学特征进行了筛选和限定,PCA是一种常用的降维方法,它可以通过线性变换将原始数据变换为一组各维度线性无关的表示,以此来提取数据的主要线性分量,在特征选择中应用广泛。Kickingereder等[15]利用PCA建立的影像组学模型预测GBM患者贝伐单抗治疗后的反应,AUC达到0.90;目前有研究表明[11]同一机器学习模型中,不同的特征选择降维方法会产生一定诊断差异,因此下一步研究中我们将采用不同的特征选择与降维方法来比较诊断差异。

       本研究的局限性:(1)本研究为回顾性研究,研究样本数量少,仅仅采用内部数据对不同影像组学诊断模型进行验证,今后还需收集更多样本数据进行外部验证;此外,本研究ROI分割采用肿瘤最大横截面进行2D分割,有研究表明3D分割可以更好地反映肿瘤的异质性[16],但目前对3D分割是否有助于模型诊断效能改善的意见并不一致[17],不过可以肯定的是,使用2D分割可以大大减少计算时间和资源,降低操作者间差异。(2)研究样本时间跨度较大,部分样本组织学病理资料不全,没有根据2016年WHO胶质瘤分级[18]将分子诊断标记与影像组学特征连接起来,本研究的重点是区分HGG和LGG,因此未来我们将把此项内容作为研究方向。

       综上所述,影像组学诊断模型可以对胶质瘤的病理分级进行良好的区分,不同常规MRI图像、不同机器学习模型对诊断效能有一定影响,在未来临床应用中需采用适合的MRI图像和机器学习模型,进一步提高胶质瘤术前分级影像组学诊断模型的诊断效能。

[1]
Filippini G. Epidemiology of primary central nervous system tumors. Handb Clin Neurol, 2012, 104(104): 3.
[2]
Louis DN, Ohgaki H, Wiestler OD, et al. The 2007 who classification of tumours of the central nervous system. Acta Neuropathol, 2007, 114(2): 97-109.
[3]
Alattar AA, Brandel MG, Hirshman BR, et al. Oligodendroglioma resection: a surveillance, epidemiology, and end results (seer) analysis. J Neurosurg, 2017, 128(4): 1076-1083.
[4]
Raab SS, Dana Marie G, Janosky JE, et al. Clinical impact and frequency of anatomic pathology errors in cancer diagnoses. Cancer, 2010, 104(10): 2205-2213.
[5]
Suh HB, Choi YS, Bae S, et al. Primary central nervous system lymphoma and atypical glioblastoma: differentiation using radiomics approach. Eur Radiol, 2018, 28(9): 3832-3839.
[6]
Yang D, Rao G, Martinez J, et al. Evaluation of tumor-derived mri-texture features for discrimination of molecular subtypes and prediction of 12-month survival status in glioblastoma. Med Phys, 2015, 42(11): 6725-6735.
[7]
Li Y, Liu X, Xu K, et al. Mri features can predict egfr expression in lower grade gliomas: a voxel-based radiomic analysis. Eur Radiol, 2017, 28(1): 356-362.
[8]
Tian Q, Yan LF, Zhang X, et al. Radiomics strategy for glioma grading using texture features from multiparametric mri. J Magn Reson Imaging, 2018, 48(6): 1518-1528.
[9]
Breiman L. Random forests. Machine Learning, 2001, 45(1): 5-32.
[10]
Parmar C, Grossmann P, Bussink J, et al. Machine learning methods for quantitative radiomic biomarkers. Sci Rep, 2015, 5(1): 13087.
[11]
Montazeri M, Montazeri M, Montazeri M, et al. Machine learning models in breast cancer survival prediction. Technol Health Care, 2015, 24(1): 31-42.
[12]
Qin JB, Liu Z, Zhang H, et al. Grading of gliomas by using radiomic features on multiple magnetic resonance imaging (mri) sequences. Med Sci Monit, 2017, 23(1): 2168-2178.
[13]
Skogen K, Schulz A, Dormagen JB, et al. Diagnostic performance of texture analysis on mri in grading cerebral gliomas. Eur J Radiol, 2016, 85(4): 824-829.
[14]
Ryu YJ, Seung Hong C, Joon PS, et al. Glioma: application of whole-tumor texture analysis of diffusion-weighted imaging for the evaluation of tumor heterogeneity. PLoS One, 2014, 9(9): e108335.
[15]
Kickingereder P, Götz M, Wick A, et al. Large-scale radiomic profiling of recurrent glioblastoma identifies an imaging predictor for stratifying anti-angiogenic treatment response. Clin Cancer Res, 2017, 22(23): 5765-5771.
[16]
Ng F, Kozarski R, Ganeshan B, et al. Assessment of tumor heterogeneity by ct texture analysis: can the largest cross-sectional area be used as an alternative to whole tumor analysis? Eur J Radiol, 2013, 82(2): 342-348.
[17]
Lubner MG, Stabo N, Lubner SJ, et al. Ct textural analysis of hepatic metastatic colorectal cancer: pre-treatment tumor heterogeneity correlates with pathology and clinical outcomes. Abdom Imaging, 2015, 40(7): 2331-2337.
[18]
Louis DN, Perry A, Reifenberger G, et al. The 2016 world health organization classification of tumors of the central nervous system: a summary. Acta Neuropathol, 2016, 131(6): 803-820.

上一篇 一种改进的定量磁化率成像多回波场图拟合算法
下一篇 右侧侧脑室三角区神经鞘瘤一例
  
诚聘英才 | 广告合作 | 免责声明 | 版权声明
联系电话:010-67113815
京ICP备19028836号-2