这次是GBD数据库的第15篇推文,
这一期,我们将介绍GBD数据库的第2个预测包——BAPC.
关于数据准备,大家可以参考第14篇推文,包括年龄结构数据以及人口数据都可以下载。
下面,我们直接进入到R语言分析过程。
首先,我们设置路径,读取R包

我们读取相应的数据,包括设定3个年龄向量用来提取

读取标准年龄结构数据

由于BAPC需要的数据结构和nordpred不同,BAPC行为年份,列为年龄,此外数据需要为整数,因此我们这里整理成0-4到95 plus的数据。考虑到不同性别发病率不同,所以这里我们分开预测男女的发病率。因此我们需要分开提取并整理男女数据,
我们首先整理男性数据

接着整理女性数据

同样的,我们读取GBD的1990-2019人口学数据

接着我们读取预测的2020-2030人口学数据

接着我们将<1以及1-4岁整合成0-4岁

接着我们整理人口学数据,变成BAPC能够识别的数据形式

由于BAPC需要将预测的行也要添加至发病数据中,因为我们预测2020-2030的情况,所以我们对其进行补充

数据准备好后,我们可以进行食管癌的发病情况预测
这里简单讲下参数设置(个人理解,不一定准确):gf值代表年龄分层与year的比值,比如我们这里年龄是5岁为一组,而year是1年为一组,所以gf=5
Npredict个人不是很理解,这里暂时给不了很好的解释,stdweight需要输入标准人口年龄结构用来计算ASR

接下来计算每个年龄层的发病数

计算每个年龄层的发病率

计算标准发病率

计算总发病人数

计算总的标准发病率

计算总发病人数

最后大家可以用R包最带的画图功能看下做的图形

我们一起来看下图形
这个是男性的标准发病率预测

这个是女性的标准发病率预测

最后大家可以将拿到的预测数据进行进一步的分析。
