R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

image.png
  1. R语言机器学习算法实战系列(一)XGBoost算法+SHAP值(eXtreme Gradient Boosting)
  2. R语言机器学习算法实战系列(二) SVM算法+重要性得分(Support Vector Machine)
  3. R语言机器学习算法实战系列(三)lightGBM算法+SHAP值(Light Gradient Boosting Machine)
  4. R语言机器学习算法实战系列(四)随机森林算法+SHAP值 (Random Forest)
  5. R语言机器学习算法实战系列(五)GBM算法+SHAP值 (Gradient Boosting Machines)
  6. R语言机器学习算法实战系列(六)K-邻近算法 (K-Nearest Neighbors)
  7. R语言机器学习算法实战系列(七)朴素贝叶斯分类算法 (Naïve Bayes Classifier)
  8. R语言机器学习算法实战系列(八)逻辑回归算法 (logistic regression)
  9. R语言机器学习算法实战系列(九)决策树分类算法 (Decision Trees Classifier)
  10. R语言机器学习算法实战系列(十)自适应提升分类算法 (Adaptive Boosting)
  11. R语言机器学习算法实战系列(十一)MLP分类算法 (Multi-Layer Perceptrons)
  12. R语言机器学习算法实战系列(十二)线性判别分析分类算法 (Linear Discriminant Analysis)
  13. R语言机器学习算法实战系列(十三)随机森林生存分析构建预后模型 (Random Survival Forest)
  14. R语言机器学习算法实战系列(十四): CatBoost分类算法+SHAP值 (categorical data gradient boosting)
  15. R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)
  16. R语言机器学习算法实战系列(十六)随机森林算法回归模型+SHAP值(Random Forest Regression + SHAP)
  17. R语言机器学习算法实战系列(十七)特征选择之弹性网络回归算法(Elastic Net Regression)
  18. R语言机器学习算法实战系列(十八)特征选择之LASSO算法(Least Absolute Shrinkage and Selection Operator Regression)
  19. R语言机器学习算法实战系列(十九)特征选择之Monte Carlo算法(Monte Carlo Feature Selection)
  20. R语言机器学习算法实战系列(二十)特征选择之Boruta算法

机器学习论文

  1. R语言机器学习论文(一):研究背景
  2. R语言机器学习论文(二):数据准备
  3. R语言机器学习论文(三):特征提取
  4. R语言机器学习论文(四):模型构建
  5. R语言机器学习论文(五):解释模型
  6. R语言机器学习论文(六):总结

介绍

随机森林生存分析(Random Survival Forest,简称RSF)是一种用于处理右删失数据(即生存时间数据)的机器学习方法,它是传统随机森林算法在生存分析领域的扩展。RSF的目标变量是生存时间,它考虑了每个样本的生存时间(T)和删失时间(C),其中删失时间指的是在观察期间内未发生感兴趣事件的时间。RSF框架的核心步骤包括:

  1. 数据重采样:从原始数据中抽取多个bootstrap样本,每个样本平均排除一定比例的数据,称为袋外数据(Out-Of-Bag, OOB)。
  2. 构建生存树:对每个bootstrap样本构建一棵二叉生存树。在树的每个节点上,随机选取一定数量的候选变量,并使用最大化子节点之间生存差异的候选变量进行拆分。
  3. 生长限制:在叶节点不少于一定数量死亡事件的约束下,将树生长到完整大小。
  4. 累积风险函数:对每棵树计算累积风险函数(Cumulative Hazard Function, CHF),得到集成累积风险函数的均值。
  5. 预测误差计算:使用OOB数据,计算集成累积风险函数预测误差。

教程

本文旨在通过R语言实现Random Survival Forest,总共包含:

  1. 加载R包
  2. 案例数据
  3. 数据预处理
  4. 数据描述
  5. 构建randomForestSRC模型
  6. 评估模型
  7. 特征重要性(筛选特征)
  8. 构建新模型
  9. 模型解释SHAP
  10. 保存模型
  11. 总结
  12. 系统信息

更多内容请前往

R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)

image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容