时间序列分析 - ARMA, ARIMA, SARIMA

2024-02-16 01:38

本文主要是介绍时间序列分析 - ARMA, ARIMA, SARIMA,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【目标数据】

ARMA: 针对弱平稳/宽平稳时间序列分析

ARIMA: 针对非平稳非周期性时间序列分析

SARIMA: 针对非平稳周期性时间序列分析。

 

自协方差与自相关系数

时间序列在t时刻记作Xt,在s时刻记作Xs,那么这两个时刻对应的时间序列的自协方差的计算公式为:

\gamma(t,s)=E[(Xt-\bar{Xt})(Xs-\bar{Xs})]

假设时间间隔t-s=k, 并且假设时间序列的均值为常数u, 那么上述公式可以写成

\gamma(k)=\gamma(t,s)=E[(Xt-\mu )(Xs-\mu)]

自相关系数的表达式为:

\rho (k)=\rho (t,s)=\frac{\gamma (t,s)}{\sqrt{​{\sigma_{t}^{2} }}\sqrt{​{\sigma_{s}^{2} }}}

如果方差恒定,上述公式可以写成:

\rho (k)=\frac{\gamma (k)}{\sigma ^{2}}

 

【平稳性】

满足以下三个条件即为宽平稳:

1)均值为常数

2)自协方差仅与时间差相关,与具体时刻无关

3)自相关系数仅与时间差相关,与具体时刻无关。或者说方差为常数。

非平稳的时间序列可以通过差分使其变为平稳的时间序列。

 

【平稳性检验】

ADF检验(单位根检验):

单位根检验是指检验序列中是否存在单位根,如果存在单位根就说明是非平稳时间序列。

python的statsmodels.tsa.stattools.adfuller提供了单位根检验方法。

 

【滞后算子表示法】

时间序列中,通常用L或者B表示之前的若干值,假设时间序列为:

X=\{X_{1},X_{2},\dots \}\,

那么对于t>1:

\,LX_{t}=X_{​{t-1}} 或者

{\displaystyle \,BX_{t}=X_{t-1}}  或者

\,X_{t}=LX_{​{t+1}}\;t\geq 1\, 或者

\,L^{​{-1}}X_{​{t}}=X_{​{t+1}}\, 以及

\,L^{k}X_{​{t}}=X_{​{t-k}}.\,

 

【ARMA】

Autoregressive–moving-average model 自回归移动平均

包含对过去值的p阶回归以及过去error误差的q阶移动平均。

如果用AR(p)来描述,公式可以写成:

X_{t}=c+\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\varepsilon _{t}.\,


其中\varepsilon _{t}是高斯白噪声。

用MA(q)来描述,公式为:

X_{t}=\mu +\varepsilon _{t}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}\,

μ 是 X_{t}的均值 (often assumed to equal 0),  \varepsilon _{t}, \varepsilon _{t-1},... 是白噪声.

将AR与MA综合起来,可以表示为:

X_{t}=c+\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}.\,

忽略常数项c,将X移至等号左侧,用滞后算子表示法:

\left(1-\sum _{i=1}^{p}\varphi _{i}L^{i}\right)X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,,

简化表示:

\varphi (L)X_{t}=\theta (L)\varepsilon _{t}\,或者 {\frac {\varphi (L)}{\theta (L)}}X_{t}=\varepsilon _{t}\,.

其中:

\varphi (L)=1-\sum _{i=1}^{p}\varphi _{i}L^{i}.\,     \theta (L)=1+\sum _{i=1}^{q}\theta _{i}L^{i}.\,

 

【ARIMA】

Autoregressive integrated moving average

对于非平稳并且非周期的时间序列,可以通过差分操作使之变为平稳时间序列,差分是指将当前时刻的值减去前一时刻的值,得到的时间序列还可以继续差分下去,比如总共进行了d次差分操作,那么叫做d阶差分,因此ARIMA在ARMA的基础上进行了d阶差分操作以后的公式为:

{\displaystyle \left(1-\sum _{i=1}^{p}\phi _{i}L^{i}\right)(1-L)^{d}X_{t}=\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}\,}

 

【SARIMA】

周期性时间序列,可以作为ARIMA的扩展,因此,首先需要去除周期性,去除的方式是在周期间隔上做一次ARIMA,此时可以得到一个非平稳非周期性的时间序列,然后在此基础之上再一次使用ARIMA进行分析。可以表示为:

ARIMA(p, d, q) × (P, D, Q)S ,其中各参数含义为:

  • P: 周期性自回归阶数.
  • D: 周期性差分阶数.
  • Q: 周期性移动平均阶数.
  • S: 周期时间间隔.

p,d,q的含义与上面的ARIMA里面含义相同。

举个例子:对于周期为12的非平稳时间序列,那么ARIMA(3,1,0) x (2,1,0)12的含义为:

D=1意味着当前时刻t的值与过去一个周期时间点t-12的1阶差分,

P=2意味着当前时刻t的值是过去两个周期时间点t-12以及t-24的回归。

处理以后得到的时间序列再通过ARIMA(3,1,0)进行分析。

 

参考:

https://en.wikipedia.org/wiki/Autoregressive%E2%80%93moving-average_model

https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average

https://en.wikipedia.org/wiki/Lag_operator

https://machinelearningmastery.com/sarima-for-time-series-forecasting-in-python/

 

这篇关于时间序列分析 - ARMA, ARIMA, SARIMA的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/713135

相关文章

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

uva 10131 最长子序列

题意: 给大象的体重和智商,求体重按从大到小,智商从高到低的最长子序列,并输出路径。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vect

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

POJ1631最长单调递增子序列

最长单调递增子序列 import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import java.io.PrintWriter;import java.math.BigInteger;import java.util.StringTokenizer;publ

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

leetcode105 从前序与中序遍历序列构造二叉树

根据一棵树的前序遍历与中序遍历构造二叉树。 注意: 你可以假设树中没有重复的元素。 例如,给出 前序遍历 preorder = [3,9,20,15,7]中序遍历 inorder = [9,3,15,20,7] 返回如下的二叉树: 3/ \9 20/ \15 7   class Solution {public TreeNode buildTree(int[] pr