分享:
分享到微信朋友圈
X
技术研究
基于结构MRI和机器学习的阿尔茨海默病病程分类研究
姚丽丽 范炤

Cite this article as: Yao LL, Fan Z. A machine learning model for early diagnosis of Alzheimer's disease[J]. Chin J Magn Reson Imaging, 2021, 12(6): 78-82.本文引用格式:姚丽丽, 范炤. 基于结构MRI和机器学习的阿尔茨海默病病程分类研究[J]. 磁共振成像, 2021, 12(6): 78-82. DOI:10.12015/issn.1674-8034.2021.06.015.


[摘要] 目的 利用机器学习算法对阿尔茨海默病(Alzheimer's disease,AD)病程进行分类,为临床早期诊断AD提供辅助工具。材料与方法 将AD病程分为正常认知者、早期轻度认知障碍、晚期轻度认知障碍和AD 4组,收集这些研究对象的结构磁共振成像(structure magnetic resonance imaging,sMRI)数据,在此基础上加入年龄、性别、教育水平和简易智力状态检查(Mini-Mental State Examination,MMSE)评分,然后分别基于两个数据集用L1正则化支持向量机(L1 regularized support vector machine,L1-SVM)算法进行特征选择得到对分类组贡献最大的特征,将提取到的特征子集放入误差逆传播(back propagation,BP)神经网络模型中进行分类,并且与逻辑回归、随机森林、支持向量机3种机器学习模型作对比。用十折交叉验证法比较4种模型的准确率并给出最优组合模型的特异度、敏感度和AUC值。结果 加入3项人口统计学指标和MMSE评分的特征集优于仅具有sMRI的特征集,此外,BP神经网络算法与L1-SVM特征选择算法结合的分类准确率优于其他机器学习模型,尤其是在从正常认知功能向AD转化的过程中,BP神经网络的准确率高达98.90%,敏感度98.75%,AUC值1.00。不同分类组之间略有差异。结论 L1-SVM和BP神经网络组合模型可以用于AD早期诊断,并且AD进展转化的每一阶段的相关特征数据为临床基础研究和病理变化提供了依据。
[Abstract] Objective Machine learning algorithm was used to classify the progression of Alzheimer's disease (AD) and provide an auxiliary tool for clinical early diagnosis of AD. Materials andMethods The progression of AD was divided into four groups, including normal cognitive subjects, early mild cognitive impairment, late mild cognitive impairment and AD. Structure magnetic resonance imaging (sMRI) datas were collected from these subjects. In addition, Age, sex, education level and Mini-Mental State Examination (MMSE) scores were also collected. Then, L1-regularized support vector machine (L1-SVM) algorithm was used to select the features that contributed the most to the classification group based on the two datasets respectively. The extracted feature subsets were classified in the back propagation (BP) neural network model, and compared with Logistic regression, random forest and support vector machine (SVM). The accuracy of the four models was compared with the ten fold cross validation method. The specificity, sensitivity and area under receiver operating characteristic curve (AUC) values of the optimal combination model were given.Results The feature sets with three demographic indicators and MMSE score were better than that with only sMRI feature set. The classification accuracy of BP neural network algorithm combined with L1-SVM feature selection algorithm was better than other machine learning models, especially in the process of transforming from normal cognitive function to AD. The accuracy of BP neural network was as high as 98.90%, sensitivity was 98.75%, AUC was 1.00. There were slight differences among different classification groups.Conclusions The combined model of L1-SVM and BP neural network can be used for the early diagnosis of AD, and the relevant characteristic data of each stage of AD progressive transformation provide the basis for clinical basic research and pathological changes.
[关键词] 机器学习;结构磁共振成像;阿尔茨海默病;L1正则化;逆传播;神经网络
[Keywords] machine learning;structural magnetic resonance imaging;Alzheimer's disease;L1 regularization;back propagation;neural network

姚丽丽 1   范炤 2*  

1 山西医科大学基础医学院,太原 030001

2 山西医科大学转化医学研究中心,太原 030001

范炤,E-mail:fanzhao316@163.com

全体作者均声明无利益冲突。


基金项目: 山西省重点研发计划国际合作项目 201803D421068 山西省留学回国人员科技活动择优资助项目 619017
收稿日期:2020-12-13
接受日期:2021-03-08
DOI: 10.12015/issn.1674-8034.2021.06.015
本文引用格式:姚丽丽, 范炤. 基于结构MRI和机器学习的阿尔茨海默病病程分类研究[J]. 磁共振成像, 2021, 12(6): 78-82. DOI:10.12015/issn.1674-8034.2021.06.015.

       阿尔茨海默病(Alzheimer's disease,AD)是一种具有记忆障碍和认知衰退特征的神经退行性疾病[1]。现有的治疗只能暂时帮助缓解记忆和认知问题,不能根治。为了获得疾病的控制治疗,迫切需要对AD病程进行分类,以便早期准确诊断,及时治疗。国内外大量研究人员通过研究AD患者脑神经影像学结构和功能的变化[2],试图寻找能够有助于AD临床诊断的生物标志物,为早期诊断提供价值。结构磁共振成像(structural magnetic resonance imaging,sMRI)由于其无创性和高普及性的优点,广泛应用于AD早期诊断。近年来,随着科学技术的发展,大量结合机器学习的医学图像数据被用于AD的分类预测[3],如何选择特征选择算法对疾病预测至关重要。目前,在影像学的AD研究中常采用主成分分析法、偏最小二乘法等进行降维[4],使用支持向量机(support vector machine,SVM)、逻辑回归(logistic regression,LR)、随机森林(random forest,RF)等各种分类模型[5, 6, 7]来验证和评估提取的特征是否具有良好的分类性能。这些研究证实,基于图像结构信息的疾病分类技术对临床诊断更有帮助。然而,MRI原始图像维数高,早期AD结构变化不明显以及研究样本总数的限制使得AD早期评估和诊断的发展受到限制,并且由于不同的实验条件导致研究结果的不同,至今很难有高效准确的算法能够应用于临床。因此,本研究基于sMRI数据和患者临床信息特征[年龄、性别、教育水平、简易智力状态检查(Mini-Mental State Examination,MMSE)评分]提出一种L1-SVM特征选择法,通过与SVM、RF、LR、误差逆传播(back propagation,BP)神经网络这4种分类算法结合建立并选出最合适的预测模型,并创造性地针对每一阶段病程转化给出具体的生物标志物。

1 材料与方法

1.1 研究数据来源

       本研究数据来自AD神经成像倡议(Alzheimer's Disease Neuroimaging Initiative,ADNI)数据库(http://adni.loni.usc.edu/),回顾性分析编号为4018~5210的符合标准的受试对象543例。根据ADNI标准,接受教育(或参加工作)不得少于6年的60~90岁老年人,经伦理委员会批准,所有对象均签署知情同意书。共分为4组:139名正常认知者(normal controls,NC)、220例早期轻度认知障碍患者(early mild cognitive impairment,EMCI)、108例晚期轻度认知障碍患者(late mild cognitive impairment,LMCI)和76例AD患者。各组纳入标准如下:(1) NC组:年龄、性别及教育水平均匹配;无记忆力下降;MMSE评分为24~30分;临床痴呆评定量表(clinical dementia rating,CDR) 0分;认知功能正常,基本日常活动没有障碍。(2) EMCI组:教育水平达到初中毕业水平及以上;MMSE评分为24~30分;逻辑记忆量表进行测试:教育水平为16年以上得分 9~11分,8~15年得分5~9分,7年以下得分3~6分;CDR为0.5且没有其他认知障碍;基本日常活动无障碍。(3) LMCI组:同EMCI,区别是教育水平16年以上为≤8分,8~15年得分≤4分,0~7年得分≤2分。(4) AD组:MMSE评分为20~26分;CDR为0.5或1.0;根据NINCDS/ADRDA新标准诊断为AD。

1.2 数据预处理

       收集这些研究对象的sMRI图像数据,数据集由Philips 3.0 T磁共振扫描设备采集,采集参数为:射频TR为6.8 ms,TE为3.1 ms,翻转角为9°,视野大小为:RL=204 mm/AP=240 mm/FH=256 mm,层厚为1.2 mm,层数为170,体素为1.0 mm×1.0 mm×1.2 mm。利用Free surfer 3.4.0软件将sMRI三维图像经过空间标准化、图像平滑、图像分割等一系列预处理后得到272项结构形态学指标包括70项皮层表面积(surface area,SA)、68项皮层厚度(cortical thicknesses,TA)、16项海马亚区体积(hippocampal subfield,HS)、49项皮层下体积(subcortical volume,SV)和69项皮层体积(cortical volume,CV)。除此之外还获得了对应4项临床统计数据,包括性别、年龄、教育水平和MMSE评分(见表1)。

表1  研究对象人口统计临床信息
Tab. 1  Demographic and clinical information of study subjects

1.3 特征选择算法

       本研究首先通过特征选择获得与分类相关的重要特征来增强学习算法的泛化能力,但是不再沿用传统统计学方法来进行,而是希望与分类模型一样,也通过机器学习算法能够智能化选择最优特征。SVM在分类领域里得到了广泛的研究和应用且适合本研究数据的分类问题,而其本身不具备特征选择能力,因此在SVM模型中引入正则化惩罚项来使特征个数最小化并且解决过拟合问题[8]。L1和L2正则化都可以达到这种目的,但L1比L2更容易获得稀疏解[9]。L1正则化是损失函数的惩罚项,可以对某些参数作一定的限制。因此得到损失函数:

       其中,xi为训练样本,yi为标签,w为权值系数,λ为正则化系数。w1为权值向量中各元素的绝对值之和。

       针对272项数据集和加入4项临床信息后的276项数据集这两种进行特征选择。根据特征选择后排名顺序决定预测相关度大小,各组得到的特征中排名越靠前说明对该阶段病程的影响越大。本研究数据由Python 3.7实现,包括分类模型算法的运行。

1.4 机器学习分类模型

1.4.1 SVM模型

       SVM可以利用结构风险最小化的原理将输入样本映射到高位特征空间,在此空间上构造最优分类超平面,使分类问题获得良好的泛化能力[5]。给定训练样本(xi,yi),每一个样本点xi对应一个类别标签yi,yi∈{-1,1}。SVM的最优分类函数为:

       其中,n是样本总数,参数γ是决策面位置的截距,ω为控制方向的行向量,当xi为决策面ωTx+γ=0所对应的支持向量样本点时,ωTxi+γ为-1或1。

1.4.2 BP神经网络模型

       BP神经网络是迄今为止最成功的神经网络学习算法[10]。BP神经网络的结构由输入层、隐藏层和输出层3层组成。通过采样器采样出当前网络结构并计算当前网络结构的目标函数值;根据所述目标函数值反复调整所述采样器的参数,返回执行原来的操作,直到目标函数值达到预设函数值,和(或)调整次数达到次数阈值,从而实现网络结构的自动搜索[11]。对于任意样本[xi,yi],假设输入层为α1=α01,  [xi]T,隐藏层有ɭ个神经元,输入β2=α1θ1,其中参数θ1∈Rn+1×l,输出为α2=α02,gβ2;输出层中输入β3=α2θ2,其中θ2∈Rl+1×k,输出α3=g[β3],因此模型的预测函数为hθ[xi]=α3。

1.4.3 LR模型

       LR是一种广义线性模型,往往通过最大似然法作模型估计。作为机器学习中常见的分类算法之一,常用于解决二分类问题[6]。当用其解决k类分类问题时,可将问题转化为k个二分类问题。假设θ=(θ1,θ2,...,θk)T,θ∈Rk×n+1,其中,映射参数θk=(θ0k,θ1k,...,θnk)。通过fmincg优化函数对训练集的代价函数不断进行优化。预测函数为给定输入样本x和映射参数θk时模型的预测结果表示为:s.t.hθkx=maxhθ1x,...,hθkx。

1.4.4 RF模型

       RF属于集成学习的一种,由许多决策树组成。通过构建并结合多个学习器来完成学习任务。算法的本质是通过集合树型分类器,构造不同的训练集来增加分类模型间的差异并通过投票进行分类和预测[7]。RF的决策函数为:

       其中,H(x)为组合模型函数,hi(x)表示单个决策树,Y表示目标变量,经过k轮训练得出最多决策树支持的一类。

1.5 模型性能评估

       本研究采用最小偏差和方差的十折交叉验证方法对各个分类模型进行评估。将数据集分成10份,随机抽取9份作为训练样本构建分类模型,另一份作为测试集对模型性能进行检验,获得分类结果,重复10次训练和测试后得到的10个测试结果均值即为该模型算法的准确率,针对本研究数据类别分布的不平衡,除了准确率这项评价指标外,还考虑了敏感度和特异度。此外,AUC也用作评估分类器性能的指标。

2 结果

2.1 特征选择结果与分类

2.1.1 272项特征选择结果

       通过L1-SVM特征选择模型提取后,在识别NC与EMCI组时,有133项特征被提取并进入分类模型。其他NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD和LMCI-AD组中,分别有86、58、112、78和78项被提取。特征选择的结果根据它们对该分类组的重要程度来排列,本研究只显示各组前10项(见表2)。从整体来看,最主要的10项特征分别为TA-左颞横回、SA-左颞下回、SV-右杏仁核、CV-右额眶回内侧、TA-左颞中回、HS-右海马前下托、SA-左颞极、CV-右额上回、CV-左扣带回后部、SA-左额眶回内侧。

表2  272项特征中贡献最大的前10项特征
Tab. 2  Top 10 important features of 272 features

2.1.2 276项特征选择结果

       将4项临床人口学指标加入到272个形态学指标后,各指标在区分每一组时的重要程度发生改变。在区分NC和EMCI组时,从276项特征中提取到的最优特征子集有121项。同样,对于NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD以及LMCI-AD这些组,分别有82、22、113、39和53项特征被提取到BP神经网络及其他模型。同样只显示贡献最大的前10项。从整体来看,最主要的10项特征分别为TA-左颞横回、MMSE评分、SA-左额眶回内侧、CV-右额眶回内侧、SA-左颞下回、SV-左腹侧间脑、TA-左颞中回、年龄、TA-右眶回、HS-右海马前下托。

       从表3可看出,MMSE评分在AD病程的各个阶段表现出非常明显的变化。在识别NC-LMCI、EMCI-AD、LMCI-AD这3组分类时,年龄有很大影响。性别的重要性微乎其微。值得一提的是,在本研究中,针对疾病病程的各个阶段特征的重要程度都展示出来。其中,在区分NC-EMCI组时,年龄排名第14位,性别排名第31位,文化程度排名第70位。对于NC-AD组,教育水平表现出显著差异,年龄和性别没有出现在最优特征的子集中;对于EMCI和LMCI组,年龄排在第11位,性别排在第28位,教育水平排在第63位;对于EMCI和AD组,教育水平排在第23位,对于LMCI和AD组,性别排在第14位。

表3  276项特征中贡献最大的前10项特征
Tab. 3  Top 10 important features of 276 features

2.2 不同分类模型预测结果

       本研究基于两种数据集提取特征后进入BP神经网络模型进行分类,并与RF、SVM、LR 3种常用预测模型进行对比。结果发现BP神经网络模型预测效果高于其他3种模型(见图1、2),而且从整体来看,在276项数据集下分类预测结果更高,尤其识别NC-AD组时准确率最高,为98.90%,而LR、SVM、RF 3种模型在识别该组时准确率分别为90.66%、92.02%、96.77%。在272项数据集下BP神经网络、LR、SVM、RF模型在识别NC-AD组时准确率分别为95.39%、89.42%、91.63%、92.18%。除此之外,BP神经网络分类模型基于276项数据集在NC-EMCI、NC-LMCI、EMCI-LMCI、EMCI-AD、LMCI-AD组的准确率分别为83.53%、95.04%、93.01%、96.93%、92.41%。除了准确率,各组在两种数据集下的特异度、敏感度也比较高,AUC值更是高达1.00 (见表4),且增加人口统计学指标前后模型的泛化能力有所提高。

图1  272项特征选择下4种分类模型结果 图2 276项特征选择下4种分类模型结果
Fig. 1  The results of four classification models were selected for 272 features. Fig. 2 The results of four classification models were selected for 276 features.
表4  BP神经网络在两种特征数据集下的分类结果
Tab. 4  Classification results of BP neural network under two characteristic data sets

3 讨论

       本研究发现了区分各分组时的关键病变部位,并按重要程度排名,更有助于预测病程进展。从272项sMRI形态学指标特征选择结果来看,最优特征子集集中分布在边缘系统和颞叶,海马、海马亚区、以及杏仁核隶属于边缘系统的组成结构[12]。这些结构都可以单独被作为研究AD病程发展的指标。

       除了与已有研究一致的脑部形态学变化之外,本研究还发现仅在某个分组中的特征变化有助于预测病程判断。TA-左颞横回在识别NC-EMCI、NC-LMCI、EMCI-AD、LMCI-AD分组的各个病程中都尤为重要,颞横回为听觉皮质区,可见在AD疾病进程中听觉的不断弱化是判断病程的重要依据,与已有研究[13]一致。而在NC-AD组中SV-左海马贡献最大,说明海马在正常人和AD患者之间的差异非常明显,海马主要负责学习和记忆,其萎缩情况反映AD病情的严重程度[14]。并且左侧大脑比右侧大脑严重,这与之前报道[13]一致。而HS-右海马前下托在识别NC-LMCI组、NC-AD组以及LMCI-AD组时排名在最优特征的前十,表明海马亚区也可被用来反映或预测疾病病程的发展,甚至有研究表明海马亚区可能更适合预测AD[15]。在区分NC-EMCI、NC-LMCI和EMCI-LMCI这3组时,SA-左颞下回对分类决策起重要作用,颞下回负责学习和记忆,在进展为LMCI的时候,患者的学习记忆表现出更多差异;由此可见,颞叶萎缩可以用来预测AD疾病的进展情况。

       本研究将MCI分成EMCI和LMCI两个阶段,对NC、EMCI、LMCI、AD 4组进行两两分类,通过具体化分类更早识别MCI阶段进而能够对AD进行早期诊断,而以往的研究[16]只对NC、MCI、AD 3组进行两两分类,也涉及BP神经网络以及其他模型,然而在NC-AD组的分类准确率一般在80%~95%。

       在sMRI基础上增加年龄、性别、教育水平3项人口统计学指标和MMSE评分后在疾病病程各阶段的准确率均高于只有272项sMRI指标的准确率,可以实现最优分类精度。无论是272项特征还是276项特征,BP神经网络分类器的整体预测效果都优于其他3种分类器。尤其在NC转化为AD的过程中,BP神经网络的准确率高达98.90%,而已有研究在引入性别、年龄后对NC-AD组的预测准确率达91.07%[17]

       本文方法对病程分类的准确率由高到低依次为NC-AD、EMCI-AD、NC-LMCI、EMCI-LMCI、LMCI-AD、NC-EMCI组。当同样的数据集采用传统统计学方法进行特征选择后用SVM分类研究[18]时准确率达90.90%,而本研究L1-SVM特征选择下该模型准确率为91.63%。传统统计学方法识别NC-AD组时准确率最高为96.45%,而本研究为98.90%,总体预测效果高于传统统计法,不同组别中结果略有差异。

       本研究顺应当下人工智能时代,提出的BP神经网络模型在L1-SVM特征选择下对NC-EMCI-LMCI-AD两两分类的预测效果较好,这种联合算法可以作为临床辅助诊断AD的有效工具。综合考虑影像数据与临床特征信息有利于精准预测AD病程,希望能够为后续的研究提供参考。同时,本研究存在局限性,后续也会增加样本量,尝试用其他影像数据,比如DTI、PET、fMRI或其他生物标志物,进一步提高比较难区分的病程分类组识别率,从而及时进行干预,阻碍病程进展,为国家和社会减轻负担。

1
Gauler J, James B, Johnson T, et al. Alzheimer's disease facts and figures[J]. Alzheimers Dement, 2018, 14(3): 367-429. DOI: 10.1016/j.jalz.2018.02.001.
2
Reitz C, Mayeux R. Alzheimer's disease: Epidemiology, diagnostic criteria, risk factors and biomarkers[J]. Biochem Pharmacol, 2014, 88(4): 640-651. DOI: 10.1016/j.bcp.2013.12.024.
3
Moira M, Clarissa F, Jorge J, et al. Predicting and tracking short term disease progression in amnestic mild cognitive impairment patients with prodromal Alzheimer's disease: Structural brain biomarkers[J]. J Alzheimer's Dis, 2018, 69(1): 3-14. DOI: 10.3233/JAD-180152.
4
Hui K, Ooi C, Lim M, et al. An improved wrapper-based feature selection method for machinery fault diagnosis[J]. PLoS One, 2017, 12(12): 0189143. DOI: 10.1371/journal.pone.0189143.
5
Gaonkar B, Shinohara R, Davatzikos C. Interpreting support vector machine models for multivariate group wise analysis in neuroimaging[J]. Med Image Anal, 2015, 24(1): 190-204. DOI: 10.1016/j.media.2015.06.008.
6
Chai H, Liang Y, Wang S, et al. A novel logistic regression model combining semi-supervised learning and active learning for disease classification[J]. Sci Rep, 2018, 8(1): 13009. DOI: 10.1038/s41598-018-31395-5.
7
Hongliu C, Simon B, Robert S, et al. Random forest dissimilarity based multi-view learning for Radiomics application[J]. Pattern Recognition, 2019, 88: 185-197. DOI: 10.1016/j.patcog.2018.11.011.
8
Shen Y, Liu Z, Ott J, et al. Support vector machines with L1 penalty for detecting gene-gene interactions[J]. Int J Data Min Bioinform, 2012, 6(5): 463-470. DOI: 10.1504/ijdmb.2012.049300.
9
Steiert B, Timmer J, Kreutz C. L1 regularization facilitates detection of cell type-specific parameters in dynamical systems[J]. Bioinformatics, 2016, 32(17): 718-726. DOI: 10.1093/bioinformatics/btw461.
10
Hu FY, Wang L, Wang SS, et al. A human body posture recognition algorithm based on BP neural network for wireless body area networks[J]. China Communications, 2016, 13(8): 198-208. DOI: 10.1109/cc.2016.7563723.
11
Deng Q. A BP neural network optimisation method based on dynamical regularization[J]. J Control Decision, 2019, 6(2): 111-121. DOI: 10.1080/23307706.2017.1419837.
12
Gertje EC, Pluta J, Das S, et al. Clinical application of automatic segmentation of medial temporal lobe subregions in prodromal and dementia-level Alzheimer's disease[J]. J Alzheimers Dis, 2016, 54(3): 1027-1037. DOI: 10.3233/JAD-160014.
13
范炤, 李彩. 基于机器学习的阿尔茨海默病病程分类[J]. 中国医学影像学杂志, 2019, 27(10): 792-795. DOI: 10.3969/j.issn.1005-5185.2019.10.019.
Fan Z, Li C. Classification of the course of Alzheimer's disease based on machine learning[J]. Chin J Med Imaging, 2019, 27(10): 792-795. DOI: 10.3969/j.issn.1005-5185.2019.10.019.
14
Dhikav V, Duraisamy S, Anand KS. Hippocampal volumes among older Indian adults: Comparison with Alzheimer's disease and mild cognitive impairment[J]. Ann Indian Acad Neurol, 2016, 19(2): 195-200. DOI: 10.4103/0972-2327.176863.
15
Vasta R, Augimeri A, Cerasa A, et al. For the Alzheimer's disease neuroimaging I. hippocampal subfield atrophies in converted and not-converted mild cognitive impairments patients by a markov random fields algorithm[J]. Curr Alzheimer Res, 2016, 13(5): 566-574. DOI: 10.2174/1567205013666160120151457.
16
Altaf T, Anwar SM, Gul N, et al. Multi-class Alzheimer's disease classification using image and clinical features[J]. Biomed Signal Process, 2018, 43(5): 64-74. DOI: 10.1016/j.bspc.2018.02.019.
17
Catani M, Dellacqua F, Thiebautde SM. A revised limbic system model for memory, emotion and behaviour[J]. Neurosci Biobehav Rev, 2013, 37(8): 1724-1737. DOI: 10.1016/j.neubiorev.2013.07.001.
18
齐雪丹. 基于脑MRI和机器学习的阿尔兹海默病病程分类研究[D]. 太原: 山西医科大学, 2018.
Qi XD. Classification of Alzheimer's disease course based on brain MRI and machine learning[D]. Taiyuan: Shanxi Med Univ, 2018.

上一篇 基于右侧脑岛功能连接性的哮喘针刺 fMRI研究
下一篇 基于Tirm序列纹理特征联合TIC曲线鉴别乳腺良恶性病变的价值
  
诚聘英才 | 广告合作 | 免责声明 | 版权声明
联系电话:010-67113815
京ICP备19028836号-2