预测模型流程图+变量重要性+决策树可视化

古月 一点统计 2023-08-04 22:22

点击上方蓝字关注,更多干货等你挖掘!

倩女幽魂

一、流程图:流程图的画法,除了用带箭头的方式,也可试试如下的方法,即采用不同模块进行区分。下图中,模块1展示数据划分;模块2展示训练集上的不平衡处理(SMOTE);模块3展示基于5折交叉验证的最优超参选择,其中又包含了5个小步骤;模块4展示测试集上的性能评价结果。
图片

二、变量重要性:变量重要性的呈现方法很多,下表也是其中之一。该表将不同模型的top10进行展示,其中0表示该变量未出现在模型中,1表示该变量出现在模型中。time表示了变量在4个模型中出现的次数。可以发现,出现此处越多的变量,说明在各个模型中都很关键,也就是稳健的预测因素。当然,这种呈现方式,无法知道每个变量的重要性大小。因此,朋友们可以将重要性和下表进行结合,可展现更多丰富的信息。
图片

三、决策树可视化:决策树的一大好处是其结果容易理解,可视化效果好。如下图所示,可以清晰看到每一条决策路径。
图片

Reference: Developing a machine learning model to identify delirium risk in geriatric internal medicine inpatients.

点赞+分享,支持小编哦~

收录于合集 #文献速递
 149
上一篇特征选择:到底选几个变量好,谁说了算?下一篇前方高能:预测模型知识精粹!

微信扫一扫
关注该公众号