点击上方蓝字关注,更多干货等你挖掘!一、流程图:流程图的画法,除了用带箭头的方式,也可试试如下的方法,即采用不同模块进行区分。下图中,模块1展示数据划分;模块2展示训练集上的不平衡处理(SMOTE);模块3展示基于5折交叉验证的最优超参选择,其中又包含了5个小步骤;模块4展示测试集上的性能评价结果。
二、变量重要性:变量重要性的呈现方法很多,下表也是其中之一。该表将不同模型的top10进行展示,其中0表示该变量未出现在模型中,1表示该变量出现在模型中。time表示了变量在4个模型中出现的次数。可以发现,出现此处越多的变量,说明在各个模型中都很关键,也就是稳健的预测因素。当然,这种呈现方式,无法知道每个变量的重要性大小。因此,朋友们可以将重要性和下表进行结合,可展现更多丰富的信息。
三、决策树可视化:决策树的一大好处是其结果容易理解,可视化效果好。如下图所示,可以清晰看到每一条决策路径。Reference: Developing a machine learning model to identify delirium risk in geriatric internal medicine inpatients.
一点统计 统计学习第一站,陪有梦想的你一起成长,每晚22点22分准时分享。
283篇原创内容
公众号
,