【学习笔记】时间序列模型(ARIMA)

2024-08-25 03:04

文章标签 学习笔记模型时间序列 arima

本文主要是介绍【学习笔记】时间序列模型(ARIMA)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章目录

前言
一、时间序列
- 时间序列数据
二、ARIMA 模型大纲
- 模型前提
- - 平稳性检验
- 差分整合移动平均自回归模型 ARIMA(p,q,d)
- - 自回归模型 (AR( p ))
  - 移动平均模型 (MA( q ))
  - 自回归移动平均模型(ARMA(p,q))
  - 差分自回归移动平均模型 ARIMA(p,d,q)
- 确定 p，q
- 结果分析和模型检验

前言

通过模型算法，熟练对 python 的应用。
学习视频链接：
https://www.bilibili.com/video/BV1EK41187QF?p=50&vd_source=67471d3a1b4f517b7a7964093e62f7e6

一、时间序列

时间序列也称动态序列，是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可分成三大部分，分别是描述过去、分析规律和预测未来，本文主要介绍时间序列分析中常用 ARIMA 模型。

时间序列数据

对同一对象在不同时间连续观察所取得的数据，它具备两个要素，第一个要素是时间要素，第
二个要素是数值要素

时间序列根据时间和数值性质的不同，可以分为时期时间序列和时点时间序列

时期序列中，数值要素反映现象在一定时期内发展的结果
时点序列中，数值要素反映现象在一定时点上的瞬间水平

时期序列可加，时点序列不可加

二、ARIMA 模型大纲

在这里插入图片描述

ARIMA 模型的建模步骤

对序列绘图，进行平稳性检验，观察序列是否平稳；对于非平稳时间序列要先进行 d 阶差分，
转化为平稳时间序列；
经过第一步处理，已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数(ACF)
和偏自相关系数(PACF),通过对自相关图和偏自相关图的分析，得到最佳的阶数 p、q ；
由以上得到的 d、q、p，得到 ARIMA 模型。然后开始对得到的模型进行模型检验。

模型前提

平稳性

平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时间内仍然能够按照现有
的形态延续下去
平稳性要求序列的均值和方差不发生明显变化
- 严平稳：序列所有的统计性质(期望，方差)都不会随着时间的推移而发生变化
- 宽平稳：期望与相关系数(依赖性)不变，就是说 $t$ 时刻的值 $X$ 依赖于过去的信息

差分法实现

时间序列在 $t$ 和 $t - 1$ 时刻的差值，将非平稳序列变平稳。
$\Delta yx=y(x+1)-y(x),(x=0,1,2,...)$
比如一组数列 [0,1,2,3,4,5,6,7]
进行差分后就会得到新数列 [1,1,1,1,1,1]

平稳性检验

对于一个时间序列，如何确定它是否满足平稳性要求？
通常采用图检验法(通过时间序列趋势图或者自相关函数图判断) 或 ADF 检验

ADF检验

ADF 大致的思想就是基于随即游走(不平稳的一个特殊序列)的，对其进行回归，如果发现 $p = 1$ ,说明序列满足随机游走，就是非平稳的

图检验法

自相关系数（ACF）
有序的随机变量序列与其自身相比较。自相关系数反映了同一序列在不同时序的取值之间的相关性，对于时间序列 $y_t$ ， $y_t$ 与 $y_{t-k}$ 的相关系数称为 $y_t$ 间隔 $k$ 的自相关系数。
偏自相关系数 (PACF)
为了能单纯测度 $y (t - k)$ 对 $y (t)$ 的影响，引进偏自相关系数 $(P A CF)$ 的概念。对于平稳时间序列 ${y(t)\}$ ，所谓滞后 $k$ 偏自相关系数指在剔除了中间 $k - 1$ 个随机变量 $y (t - 1), y (t - 2), ..., y (t - k + 1)$ 的干扰之后， $y (t - k)$ 对 $y (t)$ 影响的相关程度。

下图是训练集的 ACF 和 PACF 图，由图形可以看出，大部分的值都落在了置信区间内，可以把训练集本身作为平稳序列，无需差分。

差分整合移动平均自回归模型 ARIMA(p,q,d)

自回归模型 (AR( p ))

描述当前值和历史值之间的关系，用变量自身的历史数据对自身进行预测，其必须要满足平稳性要求，只适用于预测与自身前期相关的现象(时间序列的自相关性)
$p$ 阶自回归过程的公式定义： $y_\mathrm{t}=\mu+\sum_{i=1}^p\gamma_iy_{t-i}+\epsilon_t,p$ 表示用几期的历史值来预测
$y_t$ 是当前值 $\mu$ 是常数项 $p$ 是阶数 $\gamma_i$ 是自相关系数

移动平均模型 (MA( q ))

移动平均模型关注的是自回归模型中误差项的累计
$q$ 阶自回归过程的公式定义： $y_\mathrm{t}=\mu+\epsilon_t+\sum_{i=1}^q\theta_i\epsilon_{t-i}$
即时间序列当前值与历史值没有关系，而只依赖于历史白噪声的线性组合
移动平均法能有效地消除预测中的随机波动

自回归移动平均模型(ARMA(p,q))

自回归与移动平均的结合
公式定义： $y_{\mathrm{t}}=\mu+\sum_{i=1}^{p}\gamma_{i}y_{t-i}+\epsilon_{t}+\sum_{i=1}^{q}\theta_{i}\epsilon_{t-i}$
该式表明：
- 一个随机时间序列可以通过一个自回归移动平均模型来表示，即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。
- 如果该序列是平稳的，即它的行为并不会随着时间的推移而变化，那么我们就可以通过该序列过去的行为来预测未来。

差分自回归移动平均模型 ARIMA(p,d,q)

将自回归模型 $(A R)$ 、移动平均模型 $(M A)$ 和差分法结合，我们就得到了差分自回归移动平均模型 ${ARIMA}(p,d,q)$
$p$ 是自回归项， $q$ 为移动平均项数， $d$ 为时间序列成为平稳时所做的差分次数
原理：将非平稳时间序列转化为平稳时间序列然后将因变量仅对它的滞后值以及随机误差项的
现值和滞后值进行回归所建立的模型

确定 p，q

1. 相关函数法

拖尾和截尾：拖尾指序列以指数率单调递减或震荡衰减，而截尾指序列从某个时点变得非常小

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2. AIC、BIC准则

AIC 准则全称是最小化信息量准则( Akaike Information Criterion):
$A I C = - 21 n (L) + 2 K$ ，其中 $L$ 表示模型的极大似然函数， $K$ 表示模型参数个数
AIC 准则存在一定的不足。当样本容量很大时，在 AIC 准则中拟合误差提供的信息就要受到样本容量的放大，而参数个数的惩罚因子却和样本容量没关系(一直是2)，因此当样本容量很大时，使用 AIC 准则的模型不收敛于真实模型，它通常比真实模型所含的未知参数个数要多
BIC( Bayesian InformationCriterion)贝叶斯信息准则弥补了 AIC 的不足：
$B I C = - 21 n (L) + K 1 n (n)$ ，其中 n 表示样本容量。
显然，这两个评价指标越小越好。我们通过网格搜索，确定 AIC、BIC 最优的模型 (p、q)

以 BIC 准则为例,确定 p,q 的取值范围为 [0,5]，通过循环网格搜索所有组合的 BIC 的值,得到结果如下图
在这里插入图片描述
可以看到，BIC最小值的组合为 (‘AR1’,‘MA0’)

结果分析和模型检验

检验参数估计的显著性( t 检验)
检验残差序列的随机性，即残差之间是独立的 $e_i=y_i-\hat{y}_i$
残差序列的随机性可以通过自相关函数法来检验,即做残差的自相关函数图
从 ACF 图中可以看出残差之间独立性比较高

在这里插入图片描述

这篇关于【学习笔记】时间序列模型(ARIMA)的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1104360。 23002807@qq.com

相关文章

Java领域模型示例详解

Java领域模型示例详解

《Java领域模型示例详解》本文介绍了Java领域模型（POJO/Entity/VO/DTO/BO）的定义、用途和区别,强调了它们在不同场景下的角色和使用场景,文章还通过一个流程示例展示了各模型如何协... 目录Java领域模型（POJO / Entity / VO/ DTO / BO）一、为什么需要领域模

阅读更多...

深入理解Redis线程模型的原理及使用

深入理解Redis线程模型的原理及使用

《深入理解Redis线程模型的原理及使用》Redis的线程模型整体还是多线程的,只是后台执行指令的核心线程是单线程的,整个线程模型可以理解为还是以单线程为主,基于这种单线程为主的线程模型,不同客户端的... 目录1 Redis是单线程www.chinasem.cn还是多线程2 Redis如何保证指令原子性2.

阅读更多...

java时区时间转为UTC的代码示例和详细解释

java时区时间转为UTC的代码示例和详细解释

《java时区时间转为UTC的代码示例和详细解释》作为一名经验丰富的开发者,我经常被问到如何将Java中的时间转换为UTC时间,：本文主要介绍java时区时间转为UTC的代码示例和详细解释,文中通... 目录前言步骤一：导入必要的Java包步骤二：获取指定时区的时间步骤三：将指定时区的时间转换为UTC时间步

阅读更多...

Linux五种IO模型的使用解读

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型（阻塞、非阻塞、IO复用、信号驱动、异步）,重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

阅读更多...

Python的Darts库实现时间序列预测

Python的Darts库实现时间序列预测

《Python的Darts库实现时间序列预测》Darts一个集统计、机器学习与深度学习模型于一体的Python时间序列预测库,本文主要介绍了Python的Darts库实现时间序列预测,感兴趣的可以了解... 目录目录一、什么是 Darts？二、安装与基本配置安装 Darts导入基础模块三、时间序列数据结构与

阅读更多...

MyBatis Plus实现时间字段自动填充的完整方案

MyBatis Plus实现时间字段自动填充的完整方案

《MyBatisPlus实现时间字段自动填充的完整方案》在日常开发中,我们经常需要记录数据的创建时间和更新时间,传统的做法是在每次插入或更新操作时手动设置这些时间字段,这种方式不仅繁琐,还容易遗漏,... 目录前言解决目标技术栈实现步骤1. 实体类注解配置2. 创建元数据处理器3. 服务层代码优化填充机制详

阅读更多...

C++统计函数执行时间的最佳实践

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

阅读更多...

C# LiteDB处理时间序列数据的高性能解决方案

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章：LiteDB时间序列数据模型设计1.1 核心设计原则

阅读更多...

Unity新手入门学习殿堂级知识详细讲解（图文）

Unity新手入门学习殿堂级知识详细讲解（图文）

《Unity新手入门学习殿堂级知识详细讲解（图文）》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

阅读更多...

MySQL按时间维度对亿级数据表进行平滑分表

MySQL按时间维度对亿级数据表进行平滑分表

《MySQL按时间维度对亿级数据表进行平滑分表》本文将以一个真实的4亿数据表分表案例为基础,详细介绍如何在不影响线上业务的情况下,完成按时间维度分表的完整过程,感兴趣的小伙伴可以了解一下... 目录引言一、为什么我们需要分表1.1 单表数据量过大的问题1.2 分表方案选型二、分表前的准备工作2.1 数据评估

阅读更多...