本文主要是介绍算法笔记:地理探测器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 空间分层异质性(spatial stratified heterogeneity)
- 空间分层异质性(空间分异性/区异性):层内方差小于层间方差的地理现象
- 例如气 候带、土地利用图、地貌图、生物区系、区际经济差异、城乡差异以及主体功能区等 等[,是空间数据的一大特性。
- “层(strata)”是统计学概念,对应地理上的子区域(sub region)
2 地理探测器介绍
2.1 核心思想
- 如果某个自变量(x)对某个因变量(y)有重要影响,那么自变量和因变 量的空间分布应该具有相似性
2.2 原理
2.2.1 分异及因子探测
- 探测Y的空间分异性,以及探测某因子X多大程度上解释了属性Y 的空间分异。
- 用q值度量,表达式为
-
- h = 1, …, L为变量Y或因子X的分层 【子区域数量】
- Nh和N分别为层h 和全区的单元数
- ——层h和全区的Y值的方差
- SSW和SST——层内方差之和 ,全区总方差
-
- 值越大说明Y的空间分异性越明显【值越大,说明层内方差越小,方差主要来自层间,也就是空间分异性导致的方差】
- 如果分层是由自变量X生成的,则q值越大表示自变 量X对属性Y的解释力越强,反之则越弱
- 极端情况下,q值为1表明因子X完全控制了Y 的空间分布【q为1,说明SSW为0,层内没有方差,方差全是由层间贡献的,说明层内完全一模一样,也就是因子X完美地进行了子空间的划分】
- q值为0则表明因子X与Y没有任何关系
- q值表示X解释了100×q%的Y
2.2.2 交互作用探测
- 识别不同风险因子Xs之间的交互作用
- 即评估因子X1和X2共同作用时是否会增加或减弱对因变量 Y 的解释力, 或这些因子对Y的影响 是相互独立的
- 评估的方法是
- 分别计算两种因子 X1 和 X2 对 Y 的 q 值 : q(X1) 和 q(X2)
- 计算它们交互时的q 值: q(X1 ∩ X2)
- 对 q(X1)、q(X2)与q(X1 ∩ X2) 进行比较
2.2.3 风险区探测
- 判断两个子区域间的属性均值是否有显著的差别,用t统计量来检验
- 表示子区域h内的属性均值
- 为子区域h内样本数量, Var表示方差
- 统计量t近似地服从Student's t分布,其中自由度的计算方法为:
2.2.4 生态探测
3 举例
- 对某县1998-2006年的神经管畸形出生缺陷 (NTDs) 的发生 (Y) 进行环境风险因子分析
- X包括:高程、土壤类型、流域 分区以及蔬菜产量和化肥使用量等社会经济变量
- 网格点,格点间距为1 km,共1145个,用于将Y和X匹配起来
- 图8显示了风险因子探测的结果。
- 图8a 显示了对于单个风险因子(高程等级)而言的风险区探测的结果
- 其中图8a的表格第一 行的数字“21”、“22”、“23”等是此环境因子各分区的编号,第二行是在每个类型区内的NTDs的平均发病率
- 接下来的第6~10行是各类型分区的NTDs 发病率之间是否存在统计差异的判断,采用显著性水平为0.05的t检验,“Y”表示存在显 著性差异,“N”表示不存在显著性差异
- 图8b 展示的是所有风险因子q值的计算结果,结果 表明水文流域变量 X3 具有最高的q值
- 说 明这些变量中河流是决定 NTDs 空间格局的最 主要的环境因子
- 图8c是生态探测(2.2.4)的输出,结 果显示就对NTD空间分布的作用而言,水文流 域与其他变量存在着显著差异
- 图8d是交互探 测(2.2.2)的结果,其中第3~5行是两两变量交互作用 后的q值,结果表明,任何两种变量对NTDs空 间分布的交互作用都要大于第一种变量的独自 作用
- 图8a 显示了对于单个风险因子(高程等级)而言的风险区探测的结果
参考内容:10王劲峰 (geog.com.cn)
这篇关于算法笔记:地理探测器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!