时间序列数据挖掘--机器学习+统计学方法+kdd论文(二)

2024-04-21 16:18

本文主要是介绍时间序列数据挖掘--机器学习+统计学方法+kdd论文(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

时间序列数据挖掘(二)

  • 机器学习+统计学+kdd1718论文
    • 机器学习下的时间序列
      • RNN
        • RNN使用领域
      • LSTM
    • 统计学下的时间序列
      • ARIMA
        • ARIMA的含义
        • 模型前提:平稳
        • ARIMA的数学形式
        • ARIMA模型建立步骤
        • 一些细节

机器学习+统计学+kdd1718论文

第二篇博客,接着上面的笔记写。
上一篇因为操作失误没有保存简直太失败了,这次要注意点。
这一篇主要记录我从统计学模型的角度学习时间序列模型。
因为我不是统计学学生,所以很多知识我都不是很了解,这篇博客的内容都是我现学习的,所以算是一个学习笔记吧。

机器学习下的时间序列

RNN

RNN使用领域

LSTM

统计学下的时间序列

我在网上看,常用的时间序列模型有四种:自回归模型 AR§、移动平均模型 MA(q)、自回归移动平均模型 ARMA(p,q)、自回归差分移动平均模型 ARIMA(p,d,q), 可以说前三种都是 ARIMA(p,d,q)模型的特殊形式。

ARIMA

ARIMA的含义

ARIMA包含3个部分:AR、I、MA。可见,ARIMA模型实际上是AR模型和MA模型的组合

  1. AR: auto regression,即自回归模型
  2. I: integration,即单整阶数,平稳分析后得到几阶单整
  3. MA: moving average,即移动平均模型。
模型前提:平稳

比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

  1. 平稳的时间序列,非平稳序列直接进行分析,会有伪回归问题。
  2. 检验时间平稳的方法: ADF 单位根检验(如果时间序列不稳定,也可以通过一些操作如log,差分等使得时间序列稳定,此时在 ARIMA 要将结果进行逆操作如取指数,差分的逆操作,可以得到原始数据的预测结果)
  3. ADF 单位检验:若时间序列模型中含有单位根,则模型是非平稳的。核心是单位根检验,具体的单位根检验的学习内容:
    https://wenku.baidu.com/view/b18e720b19e8b8f67c1cb9ec.html
    平稳性的定义:
    我感觉简而言之就是:一个时间序列的随机变量是稳定的,当且仅当它的所有统计特征都是独立于时间的(是关于时间的常量)。
    稳定的数据是没有趋势(trend),没有周期性(seasonality)的; 即它的均值,在时间轴上拥有常量的振幅,并且它的方差,在时间轴上是趋于同一个稳定的值的。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    使用t假设检验,当t统计量大于假设检验临界值(5%等),则接受零假设,序列不平稳;当小于临界值,则拒绝了零假设,则序列是平稳的。
    一个例子:
    使用python对某个时间序列数据进行检验,结果如下(看p-value):在这里插入图片描述
    在这里插入图片描述
    上述例子来源:
    https://www.jianshu.com/p/4130bac8ebec
ARIMA的数学形式

ARIMA(p,d,q)模型有三个参数:p,d,q

  1. p:AR/Auto-Regressive项,代表预测模型中采用的时序数据本身的滞后数(lags)
  2. d:Integrated项,代表时序数据需要进行几阶差分化,才是稳定的
  3. q:MA/Moving Average项,代表预测模型中采用的预测误差的滞后数(lags)

数学形式:
在这里插入图片描述
y表示因变量Y的差分:
在这里插入图片描述
此模型可以描述为三个部分:常数+多个时间的加权和(AR模型)+多个时间的预测误差(MA模型)

几个特列

  1. ARIMA(0,1,0) = random walk
    在这里插入图片描述
  2. ARIMA(1,0,0) = first-order autoregressive model
    在这里插入图片描述
  3. ARIMA(1,1,0) = differenced first-order autoregressive model
    在这里插入图片描述
  4. ARIMA(0,1,1) = simple exponential smoothing with growth
    在这里插入图片描述
    更多例子详见:
    https://www.cnblogs.com/bradleon/p/6827109.html
ARIMA模型建立步骤
  1. 平稳检验,得到d值:若本身序列是平稳的则d=0,若一阶差分是平稳的则d=1,以此类推。
  2. 将平稳序列画出ACF,PACF图像,得出p,q值:p的值就是ACF第一次穿过上置信区间时的横轴值,q的值就是PACF第一次穿过上置信区间的横轴值(要对平稳时间序列分别求得其自相关系数ACF 和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q)
  3. 将得到的d,p,q带入求出ARIMA模型公式:通过数据拟合出模型的函数表达式(得到参数)
  4. 使用拟合的函数可以进行预测
    在这里插入图片描述
    示例图是一个例子中的ARIMA的函数图,蓝线是输入数据,红线是拟合的值,我们使用红线就可以预测出之后的值。
    但要注意此时的出的预测是一阶差分的预测,因此需要逆求出真实值。
    上述具体的例子:
    https://www.cnblogs.com/bradleon/p/6832867.html
一些细节

对ARIMA模型一个更简洁的表述:
在这里插入图片描述
链接:https://blog.csdn.net/chanbupt/article/details/70448147

AR自回归模型
是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型.
在这里插入图片描述
MA移动平均模型
MA模型和AR大同小异,它并非是历史时序值的线性组合而是历史白噪声的线性组合。与AR最大的不同之处在于,AR模型中历史白噪声的影响是间接影响当前预测值的(通过影响历史时序值)。
MA模型使用不同阶滞后的白噪音拟合。
在这里插入图片描述
白噪声的期望是0,方差为常数。
白噪声的定义:
对于一个随机变量X(t)(t=1,2,3……),如果是由一个不相关的随机变量的序列构成的,即对于所有s不等于t,随机变量X(t)和X(s)的协方差为零,则称其为纯随机过程。对于一个纯随机过程来说,若其期望为0,方差为常数,则称之为白噪声过程。

这篇关于时间序列数据挖掘--机器学习+统计学方法+kdd论文(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/923514

相关文章

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python

Apache Tomcat服务器版本号隐藏的几种方法

《ApacheTomcat服务器版本号隐藏的几种方法》本文主要介绍了ApacheTomcat服务器版本号隐藏的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1. 隐藏HTTP响应头中的Server信息编辑 server.XML 文件2. 修China编程改错误

Java中switch-case结构的使用方法举例详解

《Java中switch-case结构的使用方法举例详解》:本文主要介绍Java中switch-case结构使用的相关资料,switch-case结构是Java中处理多个分支条件的一种有效方式,它... 目录前言一、switch-case结构的基本语法二、使用示例三、注意事项四、总结前言对于Java初学者

使用Python实现大文件切片上传及断点续传的方法

《使用Python实现大文件切片上传及断点续传的方法》本文介绍了使用Python实现大文件切片上传及断点续传的方法,包括功能模块划分(获取上传文件接口状态、临时文件夹状态信息、切片上传、切片合并)、整... 目录概要整体架构流程技术细节获取上传文件状态接口获取临时文件夹状态信息接口切片上传功能文件合并功能小

Oracle Expdp按条件导出指定表数据的方法实例

《OracleExpdp按条件导出指定表数据的方法实例》:本文主要介绍Oracle的expdp数据泵方式导出特定机构和时间范围的数据,并通过parfile文件进行条件限制和配置,文中通过代码介绍... 目录1.场景描述 2.方案分析3.实验验证 3.1 parfile文件3.2 expdp命令导出4.总结

更改docker默认数据目录的方法步骤

《更改docker默认数据目录的方法步骤》本文主要介绍了更改docker默认数据目录的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1.查看docker是否存在并停止该服务2.挂载镜像并安装rsync便于备份3.取消挂载备份和迁

JavaScript DOM操作与事件处理方法

《JavaScriptDOM操作与事件处理方法》本文通过一系列代码片段,详细介绍了如何使用JavaScript进行DOM操作、事件处理、属性操作、内容操作、尺寸和位置获取,以及实现简单的动画效果,涵... 目录前言1. 类名操作代码片段代码解析2. 属性操作代码片段代码解析3. 内容操作代码片段代码解析4.

SpringBoot3集成swagger文档的使用方法

《SpringBoot3集成swagger文档的使用方法》本文介绍了Swagger的诞生背景、主要功能以及如何在SpringBoot3中集成Swagger文档,Swagger可以帮助自动生成API文档... 目录一、前言1. API 文档自动生成2. 交互式 API 测试3. API 设计和开发协作二、使用

python忽略warnings的几种方法

《python忽略warnings的几种方法》本文主要介绍了几种在Python忽略警告信息的方法,,可以使用Python内置的警告控制机制来抑制特定类型的警告,下面就来介绍一下,感兴趣的可以了解一下... 目录方法 1: 使用 warnings 模块过滤特定类型和消息内容的警告方法 2: 使用 warnin