空间计量 | 空间面板模型

2024-08-30 15:44
文章标签 模型 空间 面板 计量

本文主要是介绍空间计量 | 空间面板模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

空间计量研究中,如果为截面数据,可使用比如空间滞后模型、空间误差模型、空间杜宾模型等。当为面板数据时则稍有不同,面板数据进行空间计量分析时,主要有三个注意点,1是数据格式的整理,包括空间权重矩阵的数据格式和面板数据的数据格式(此处需要为平衡面板数据),以及空间权重矩阵与面板数据的ID匹配;2是面板模型的选择,是固定效应还是随机效应,应该使用Hausman检验进行检验并且得出结论;3是空间计量模型的选择,应该是面板滞后模型还是面板误差模型,此处默认提供LM检验得出结果。

  • 关于第1点数据格式,如下所述:

    空间权重矩阵

    空间权重矩阵应该满足n*n阶格式,而且第1行为空间点的名称(比如31省市名称),类似如下图:

    面板数据

    面板数据即分析数据,其应该为平衡面板,比如31省市10年共计为31*10=310行数据,不能缺少某省市某年的数据,一定是31*10行数据。如果非平衡面板格式,SPSSAU会输出具体错误点便于进行排查。

    空间权重矩阵与面板数据ID的匹配

    比如31省市10年的数据,空间权重矩阵为31*31阶,但是面板数据是31*10=310行,那么二者如何去对应呢,比如空间权重矩阵里面的四川与面板数据里面的四川。SPSSAU在进行匹配时,是严格按照ID的数字大小先后顺序原则进行,即权重矩阵里面的顺序比如为:北京->天津->河北->山西…这样的顺序,那么面板数据里面的ID编号数字也要依从这样的顺序,建议研究者首先需要确保树重矩阵里面的空间点顺序,一定和面板数据里面空间点的数字大小顺序保持一致,比如下图:

    上图中左侧为权重数据例子,右侧为面板数据例子,SPSSAU在对权重矩阵和面板数据进行ID匹配时,其认为顺序为:北京->天津->河北->山西->内蒙古->吉林->….这样的顺序,那么面板数据的时候面板ID的数字大小顺序(注意是数字大小),也需要保持北京->天津->河北->山西->内蒙古->吉林->…这样完全一致的顺序。建议将面板数据ID按照权重矩阵里面的顺序依次编号为1,2,3类似这样的编号。(提示:面板ID不能使用文字格式,因为文字格式上传到SPSSAU中后会自动编码成数字并且打上标签,但原理上空间权重矩阵与面板ID的匹配是使用数字进行匹配;如果上传了文字数据,也可以使用数据编码功能对其进行编码成权重矩阵对应的空间点大小顺序)。

  • 关于第2点Hausman检验

    在进行空间面板数据分析时,SPSSAU默认提供Hausman检验,便于确定应该使用面板固定模型还是面板随机模型,多数情况下可直接使用面板固定模型即可。

  • 关于第3点空间计量模型选择

    当前默认输出LM检验,按照LM检验流程直接选择空间面板滞后模型或者空间面板误差模型,当然还有可能直接使用普通的面板模型进行分析即可,关于LM检验的判断逻辑如下图所示:

    空间面板模型时输出4个LM检验,首先针对LM-error和LM-lag进行分析,如果二者均不显著,则应该使用普通面板模型(即不考虑空间性),如果仅LM-error显著则使用空间面板误差模型,如果仅LM-lag显著则使用空间面板滞后模型,如果二者均显著,则需要进一步查看Robust LM检验;

    基于LM-error和LM-lag均显著时,则需要结合Robust LM-error和Robust LM-lag检验进一步判断,如果Robust LM-error和Robust LM-lag检验均不显著,此时退回到上一步即对比LM-error和LM-lag这两个检验对应的卡方值,哪个更大则使用更大对应的模型,比如LM-error检验的卡方值更大则使用空间面板误差模型,如果LM-lag检验的卡方值更大则使用空间面板滞后模型;如果仅Robust LM-error显著则使用空间面板误差模型,如果仅Robust LM-lag显著则使用空间面板滞后模型,如果Robust LM-error和Robust LM-lag检验二者均显著,此时可使用二者中对应卡方值更大时对应的模型(或者结合信息准则判断模型优劣),比如Robust LM-lag检验的卡方值比Robust LM-error检验时的卡方值更大,那么可使用空间面板滞后模型。

    除此之外,通常情况下,普通面板模型(即不考虑空间效应的面板模型)可作为一个参照模型与最终使用的空间模型进行对比分析。

空间面板模型案例

  • 1、背景

    当前有一份空间面板数据,其为美国1970~1974共5年48个州的面板数据,包括以下变量分别是gsp(州产出),pcap(公共资本),pc(民营资本),emp(就业量),现在希望研究州公共资本、民营资本和就业量对于州产出的影响作用关系,并且考虑空间作用。由于州产出gsp,公共资本pcap、民营资本pc和就业量emp这几个变量数字较大,因而对该4项分别取对数操作,最终部分数据如下图所示:

    上面展示的是‘分析数据’,Ln表示取对数的意思,可通过生成变量实现取对数处理,该数据共有48个州,该48个州对应的‘空间权重矩阵’如下图所示:

    图中数字1表示两个空间点(社区)之间相邻,数字0表示两个社区不相邻。需要特别注意的是,分析数据中state表示州的编号,从1到48,而且空间权重数据里面的id1,id2直到id48与该编号(state)保持一致,空间权重矩阵数据可点击此处下载。

  • 2、理论

    空间面板模型时需要注意几个问题,一是数据格式,空间面板分析时需要为平衡面板数据且其id编号需要与权重矩阵里面的顺序保持一致性;二是空间计量模型的选择,具体应该使用空间面板滞后模型还是空间面板误差模型,应该结合LM检验进行决策;三是面板模型也包括FE固定效应和RE随机效应,具体应该由hausman检验进行判断。

  • 3、操作

    本例子操作如下:

    将因变量和自变量放入对应框中,并且放好state和year(即面板数据的id和year两项),另空间模型类型上默认是滞后模型,具体应该空间面板滞后模型还是空间面板误差模型,建议以输出的LM检验进行判断和选择。另外下拉选择‘空间权重矩阵’文档即spatialpanelweight这份数据,默认对空间权重矩阵行标准化处理,需要注意的是,空间权重矩阵通常需要进行行标准化处理。

    另需要提示的是,在使用空间计量相关的方法时,其均需要‘空间权重矩阵’和‘分析数据’两份数据,并且均需要单独上传到SPSSAU中,并且对‘分析数据’进行分析时,下拉选择对应的‘空间权重矩阵’,操作上分为以下3个步骤。

    • 第1:上传‘空间权重矩阵’文档

      此处需要注意:上传的数据需要为n*n阶格式,而且第1行为空间点的名称(比如31省市的名称)。类似下图格式:

    • 第2:上传‘分析数据’文档

      此处需要注意:比如31省市数据,‘空间权重矩阵’有着该31个空间点的顺序比如北京-》天津-》河北-》山西-》…,那么‘分析数据’的31行数据也需要按此顺序才可以。

    • 第3:针对‘分析数据’进行分析,并且选择‘空间权重矩阵’文档

      此处需要注意:进行某空间研究方法时需要下拉选择‘空间权重矩阵’,选择后,SPSSAU会自动判断其是否为‘空间权重矩阵’格式,包括是否为n*n阶结构,是否具有对称性等。如果不是则会进行信息提示,请勿必注意空间权重矩阵数据格式。

  • 4、SPSSAU输出结果

    SPSSAU共输出7个表格,分别是模型基本参数等、空间面板滞后模型分析结果、空间面板模型LM检验汇总、Hausman检验结果、信息准则指标结果、空间面板滞后模型相关检验汇总和空间面板滞后模型分析结果-简化格式,如下所述。

    表格说明
    模型基本参数等输出模型的基础参数值信息等
    空间面板滞后模型分析结果输出模型的分析结果,包括回归系数和显著性检验结果等,并且包括面板固定效应和面板随机效应两个模型结果
    空间面板模型LM检验汇总输出LM检验用于判断应该是空间面板滞后模型或者空间面板误差模型
    Hausman检验结果输出Hausman检验结果用于判断面板固定FE效应模型还是面板随机RE效应模型
    信息准则指标结果输出信息准则指标等
    空间面板滞后模型相关检验汇总输出比如BP检验和JB检验等
    空间面板滞后模型分析结果-简化格式输出模型结果的简化表格格式
  • 5、文字分析

    上表格模型的基本参数信息,包括具体的空间计量模型名称,空间权重矩阵名称及是否对其进行标准化处理等,模型估计方法等,表格中仅展示模型的参数信息等无特别分析意义。

    上图展示空间面板模型时比较关键的四个检验,包括LM检验和稳健LM检验,并且分别分为LM误差检验和LM滞后检验;

    第一:首先针对LM-error和LM-lag进行分析,如果二者均不显著,则应该使用普通面板模型即可(即不考虑空间性),如果仅其中一个显著,比如仅LM-error显著则使用空间面板误差模型,如果仅LM-lag显著则使用空间面板滞后模型,如果二者均显著,则需要进一步查看Robust LM检验;

    第二:针对Robust LM-error和Robust LM-lag检验,如果仅其中一个显著,比如仅Robust LM-error显著则使用空间面板误差模型,如果仅Robust LM-lag显著则使用空间面板滞后模型,如果二者均显著,此时可使用二者中对应卡方值更大(此时更小)时对应的模型(或者结合信息准则判断模型优劣),比如Robust LM-lag检验的卡方值比Robust LM-error检验时的卡方值更大,那么可使用空间面板滞后模型,如果二者均不显著,此时可退回到LM检验进行综合判断。

    本案例数据时,首先分析LM-error检验和LM-lag,从上表可知:LM-error检验呈现出显著性(=0.000<0.05),并且LM-lag检验没有呈现出显著性(=0.142>0.05) ,意味着此时使用空间面板误差模型较为适合。与此同时,还需要结合Hausman检验结果,用于判断应该使用面板固定效应模型或是面板随机效应模型,如下:

    上表格展示Hausman检验结果,从上表可知:Hausman检验并未呈现出显著性(Chi=-10.820,=1.000>0.05),意味着相对FE模型而言,RE模型更优。结合LM检验和Hausman检验结果,最终应该使用空间面板误差模型,并且应该使用随机RE模型结果作为最终结论。因而在选择模型时,应该下拉为空间误差模型,如下图所示:

    上表格依旧展示的是空间面板滞后模型的结果,并且包括FE固定效应和RE随机效应时的结果具体解读上与普通回归的解读保持一致性,在面板滞后模型时,其模型中包括因变量空间滞后变量,其实际意义为其他地区对于本地区的影响。如果是面板误差模型时,其模型中包括误差项空间滞后项。

    上表格展示信息准则结果表格,包括llf值和另外两个值即AIC值和Schwarz准则值,llf值通常越大越好,但是AIC值和Schwarz准则值均是越小越好,如果希望对比模型优劣,可考虑使用上述三个指标,并且上述指标分为FE模型和RE模型均有提供。多数情况下并不需要关注上述指标。

    上表格展示BP检验和JB检验,分别用于异方差和正态性检验,空间计量模型时对于空间作用的关注力度明显最高,对于异方差和正态性关注度相对较低,从上表格可以看到,模型具有异方差和非正态性问题,但本文档暂不关注该两项。

    上表格展示模型的简化表格格式,并且区分为FE模型和RE模型时,并不再重复分析。

  • 6、剖析
    • 涉及以下几个关键点,分别如下:
    • 空间面板计量分析时需要注意三点,分别是数据格式(包括空间面板需要平衡数据,及权重矩阵数据,以及二者的ID顺序需要保持一致或者相等),结合LM检验判断空间计量模型的选择,结合Hausman检验选择FE模型或者RE模型。

疑难解惑

  • 因变量空间滞后项或误差空间滞后项的意义?
  • 如果是滞后模型则会有因变量空间滞后项,其实际分析意义为其他地区对于当前地区的影响作用关系;如果是空间误差模型则会有误差空间滞后项,其实际分析意义为模型无法解释的项即残差这个东西,其他地区对于当前地区的空间作用关系。

这篇关于空间计量 | 空间面板模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1121240

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号