大肠癌预测模型研究:将logistic回归和机器学习模型转化成简易的"风险得分系统"!

古月 一点统计 2023-07-08 22:22 发表于福建
点击上方蓝字关注,更多干货等你挖掘!
似水流年

今天分享一篇过于大肠癌预测的研究文献,该文纳入的模型包括logistic和神经网络。巧妙的是,作者把两个预测模型都转化成得分系统,十分有意思,一起来学习吧~
图片

Reference: Risk Scoring Systems for Predicting the Presence of Colorectal Neoplasia by Fecal Immunochemical Test Results in Chinese Population


一、研究背景
在许多国家,大肠癌(CRC)筛查已成为常规项目。其中,粪便隐血(FIT)由于可及性好、成本低、准确性较高,已成为大肠癌初筛的常用方法。对于FIT阳性患者,则可建议其前往医院做进一步的结肠镜检。

尽管联合FIT和结肠镜检,使得大肠癌发病率和患病率有所下降。但是,该方式存在一个很大不足,即其往往容易忽略掉非出血性结肠病变患者。因为FIT试验对出血性病变比较敏感,而对非出血性病变不敏感。当前,结肠镜检并不是非出血性病变患者的常规筛查项目,因此,仅通过FIT检测,大约会遗漏15%的CRC和70%的早期病变。

另一方面,对于FIT阳性者,由于健康意识或家庭经济等原因,并不是所有患者都会去参加结肠镜检。那就意味着,即使对于FIT阳性的人,也可能错过早期诊断的机会。一项关于上海居民的研究显示,仅39.8%的阳性人群会参加结肠镜检。

既往研究显示,出血性和非出血性大肠癌在生物学特征、肿瘤基因型和进展等方面都存在差异。例如,FIT阳性中发现的大肠癌患者,大多是左侧癌,且遵从腺癌→癌的演变路径;而FIT阴性中发现的大肠癌患者,大多是右侧癌,且多为锯齿状癌。与此同时,出血性和非出血性大肠癌的危险因素也存在很大差异。例如,大肠癌家族史是FIT阴性患者发生晚期结直肠癌的风险因素,而对FIT阳性患者没有统计学意义。

因此,针对FIT试验结果,开发有针对性的大肠癌筛查模型十分有必要。首先,对于FIT阳性的人,风险预测可能进一步促使他们参加结肠镜检;对于FIT阴性的人,风险预测可以进一步识别其中的高风险人群,避免漏诊。

二、研究目的
本研究主要目标是:按照不同的FIT结果(阳性和阴性),分别构建全人群和参与结肠镜检人群的大肠癌风险预测模型。与此同时,作者还将自己构建的预测模型,与如下2个方法进行比较,1)我国目前推荐的风险因素+FIT筛查方法;2)作者先前构建的评分模型(纳入了FIT)。但后两种方法都没有考虑到出血性和非出血性之间的差异。

三、数据来源
该研究数据来自2013年上海市一项大肠癌筛查项目(横断面设计),研究对象50-74岁,先前没有大肠癌病史。所有参与者都会完成两项调查,其一是大肠癌危险因素调查问卷,其二是两个FIT样本采集工具,用于粪便隐血检测。如果两项中有一项阳性,将推荐其进一步做结肠镜检。至于如何根据问卷部分判断为结肠癌高风险人群,其标准介绍如下。两次FIT样本的采集间隔为1周,其阳性检出限为100 ng Hb/mL。
图片

四、研究结局
本研究结局有两种定义方式,1)90天筛查内的大肠癌患者;2)筛查漏掉的以及2年筛查期内的大肠癌患者。此外,作者还针对参加了结肠镜检的高风险人群开展预测分析。本文的样本筛选流程图如下。
图片

五、统计分析
研究采用8:2策略将数据划分为训练和验证集。纳入的预测模型有两个,分别是:logistic回归和人工神经网络(ANN)。首先,采用单变量logistic回归进行分析,将P<0.10的变量进一步纳入多变量logistic回归分析,最后采用多变量logistic回归中有显著性的构建预测模型。

本文为进一步推动预测模型的实践,将预测模型的回归系数转化为得分系统。对于logistic回归,转化为得分系统是有标准流程的,在往期推文(重磅:一步步教会你制作预测模型的风险得分工具(Risk Score Tool))有做过详细分享哦。但是,对于ANN,一般来说其结构复杂,很难直接应用。为此,作者也采用得分系统进行转化,具体计算公式如下图(1)所示,得到的C即为变量对于结局的贡献程度。接着,将C乘以logistic回归中对应变量的系数,即可按照相同方式转化为得分系统了。
图片
图片

对于模型评价,作者纳入了众多指标,包括AUC、校准度、净重分类改善指数(NRI)、综合判别改善指数(IDI)、灵敏度、特异度、高风险人群占比、检出率(detection rate)、为了发现1个病人需筛查的人数、为了发现1个病人需要开展结肠镜检的人数。
图片

此外,作者还开展了2个敏感性分析,1)由于多数人只做了一次FIT,因而重新采用1次FIT来定义结局;2)将遗漏和1年内随访期的大肠癌患者纳入研究。
图片
图片

六、研究结果
(1)描述性分析:对比了全人群和参与镜检人群中,FIT阳性与FIT阴性者的基线资料差异(截取部分表格)
图片

(2)单因素+多因素:单因素筛选P<0.10的因素,进一步纳入多因素logistic回归分析(截取部分表格)。
图片

(3)logistic回归得分系统:下表展示的是基于logistic回归系数,制作的得分系统,即将每个因素的回归系数赋分,分值越高,大肠癌风险越高。类似第,这里对不同人群和不同FIT进行分层构建。可以发现,全人群FIT阳性和阴性的最终得分范围分别是0-10、0-14分;而镜检人群中FIT阳性和阴性的得分范围是0-17、0-9。
图片
图片

(4)ANN得分系统:本文妙在把ANN这一复杂模型也转化为得分系统了。下表中contribution表示每个因素对结局的贡献率,接着基于贡献率和logistic回归中该变量的回归系数,即可得到相应分数。对于4种不同情况,ANN得分系统的分数范围分别是0-10、0-17、0-14、0-9。
图片
图片

(5)得分系统性能:下表展示了不同人群不同FIT结果下,风险得分系统的预测能力,可以发现LR-based略好于ANN-based模型。注意,作者还给出了将FIT阳性和阴性合并后的模型,且模型性能显然比FIT分开后要好。
图片

(6)不同方法对比:本文还将FIT特异性模型与一般筛查策略(风险因素评估和FIT试验)、纳入FIT测试结果的得分系统(基于logistic回归和FIT测试的得分系统)进行比较,可以发现不同方法侧重点不同,如一般筛查策略的灵敏度略高,基于LR和FIT的得分系统特异度较高等。这里值得一提的是,作者使用的模型评价指标,除了经常使用的灵敏度、特异度外,还有几个特殊指标,平时使用不是特别多,且文中没有详细介绍其含义。小编查阅一些资料后,对其介绍如下。1)高风险人群占比,指的是预测模型识别的高风险人数占总人数的比例,个人认为该值越接近人群患病率越好,超过该值说明误诊多,低于该值说明漏诊多;2)检出率,指的是筛查出的真阳性患者占总人数的占比,例如一般筛查策略的检出率为0.25%;3)需筛查人数,指的是为了发现一个真阳性患者需要筛查的人数。
图片

(7)敏感性分析:附表2-5展示了两个敏感性分析的结果,基本上与正文结果类似,说明结果稳健。
图片
图片

图片

图片

图片

喜欢本文,记得点赞、分享哦,感谢支持~

收录于合集 #文献速递
 144
上一篇很有新意的一篇研究:应用机器学习算法预测积极老龄化下一篇遇到黑盒模型,你会选择什么方法来解释呢?小编给大家整理了一些常用技术~

微信扫一扫
关注该公众号