本文主要是介绍基于r语言的疾病制图中自适应核密度估计的阈值选择方法案例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
背景
诸如核密度估计(KDE)的平滑方法被用于控制用于计算每种疾病率的空间支持的群体基础。平滑程度由用户定义的参数(带宽或阈值)控制,该参数影响疾病图的分辨率和计算的速率的可靠性。
方法
内核,带宽的大小,是影响在KDE [在地图上的平滑的程度的关键参数 ]。带宽可以是固定的也可以是可变的(自适应的)。对于固定带宽方法,内核具有固定大小的半径,并且所有内核(圆圈)具有相同的半径。在健康研究中,固定带宽方法可能不合适,因为人口不是均匀分布在地理空间中。此外,如果圆圈落入低人口密度区域,可能会导致不稳定的比率。类似地,在自适应带宽方法中,内核半径增大或缩小以适应不同的种群大小。用于定义内核带宽的最小种群大小,以及因此地图上的平滑程度,是用户定义的参数。我们将其称为阈值(h)。
图 显示了使用疾病控制和预防中心(CDC),国家卫生统计中心(NCHS) 获得的65岁及以上男性心脏病死亡率的空间分布。我们使用具有不同阈值的自适应核密度估计方法产生该映射。
#自适应平滑bivariate. ( ,h0=1.5,hp=1,adapt=TRUE,davies.baddeley=0.025)## 带宽选择#####全局(用于自适应)带宽选择##
# ~200 secs next line; 使用“并行化”来加速
system.time( <- BOOT. (pbc,type=" ")) # 自适应引导的最小用法
# ~80 secs 设置自定义h限制; 增加参考带宽plot(hada);abline(v=hada[which.min(hada[,2]),1],col=2)
模拟基线速率和真实值(RMSE)之间的差异幅度随着L的增加而稳定。在本研究中,当L > 50时,所有年龄组均达到稳定状态。在这项研究中,我们使用了100次重复。由于估计过高和过低的百分比或
这篇关于基于r语言的疾病制图中自适应核密度估计的阈值选择方法案例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!