时间序列数据挖掘--机器学习+统计学方法+kdd论文(二)

2024-04-21 16:18

本文主要是介绍时间序列数据挖掘--机器学习+统计学方法+kdd论文(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

时间序列数据挖掘(二)

  • 机器学习+统计学+kdd1718论文
    • 机器学习下的时间序列
      • RNN
        • RNN使用领域
      • LSTM
    • 统计学下的时间序列
      • ARIMA
        • ARIMA的含义
        • 模型前提:平稳
        • ARIMA的数学形式
        • ARIMA模型建立步骤
        • 一些细节

机器学习+统计学+kdd1718论文

第二篇博客,接着上面的笔记写。
上一篇因为操作失误没有保存简直太失败了,这次要注意点。
这一篇主要记录我从统计学模型的角度学习时间序列模型。
因为我不是统计学学生,所以很多知识我都不是很了解,这篇博客的内容都是我现学习的,所以算是一个学习笔记吧。

机器学习下的时间序列

RNN

RNN使用领域

LSTM

统计学下的时间序列

我在网上看,常用的时间序列模型有四种:自回归模型 AR§、移动平均模型 MA(q)、自回归移动平均模型 ARMA(p,q)、自回归差分移动平均模型 ARIMA(p,d,q), 可以说前三种都是 ARIMA(p,d,q)模型的特殊形式。

ARIMA

ARIMA的含义

ARIMA包含3个部分:AR、I、MA。可见,ARIMA模型实际上是AR模型和MA模型的组合

  1. AR: auto regression,即自回归模型
  2. I: integration,即单整阶数,平稳分析后得到几阶单整
  3. MA: moving average,即移动平均模型。
模型前提:平稳

比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

  1. 平稳的时间序列,非平稳序列直接进行分析,会有伪回归问题。
  2. 检验时间平稳的方法: ADF 单位根检验(如果时间序列不稳定,也可以通过一些操作如log,差分等使得时间序列稳定,此时在 ARIMA 要将结果进行逆操作如取指数,差分的逆操作,可以得到原始数据的预测结果)
  3. ADF 单位检验:若时间序列模型中含有单位根,则模型是非平稳的。核心是单位根检验,具体的单位根检验的学习内容:
    https://wenku.baidu.com/view/b18e720b19e8b8f67c1cb9ec.html
    平稳性的定义:
    我感觉简而言之就是:一个时间序列的随机变量是稳定的,当且仅当它的所有统计特征都是独立于时间的(是关于时间的常量)。
    稳定的数据是没有趋势(trend),没有周期性(seasonality)的; 即它的均值,在时间轴上拥有常量的振幅,并且它的方差,在时间轴上是趋于同一个稳定的值的。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    使用t假设检验,当t统计量大于假设检验临界值(5%等),则接受零假设,序列不平稳;当小于临界值,则拒绝了零假设,则序列是平稳的。
    一个例子:
    使用python对某个时间序列数据进行检验,结果如下(看p-value):在这里插入图片描述
    在这里插入图片描述
    上述例子来源:
    https://www.jianshu.com/p/4130bac8ebec
ARIMA的数学形式

ARIMA(p,d,q)模型有三个参数:p,d,q

  1. p:AR/Auto-Regressive项,代表预测模型中采用的时序数据本身的滞后数(lags)
  2. d:Integrated项,代表时序数据需要进行几阶差分化,才是稳定的
  3. q:MA/Moving Average项,代表预测模型中采用的预测误差的滞后数(lags)

数学形式:
在这里插入图片描述
y表示因变量Y的差分:
在这里插入图片描述
此模型可以描述为三个部分:常数+多个时间的加权和(AR模型)+多个时间的预测误差(MA模型)

几个特列

  1. ARIMA(0,1,0) = random walk
    在这里插入图片描述
  2. ARIMA(1,0,0) = first-order autoregressive model
    在这里插入图片描述
  3. ARIMA(1,1,0) = differenced first-order autoregressive model
    在这里插入图片描述
  4. ARIMA(0,1,1) = simple exponential smoothing with growth
    在这里插入图片描述
    更多例子详见:
    https://www.cnblogs.com/bradleon/p/6827109.html
ARIMA模型建立步骤
  1. 平稳检验,得到d值:若本身序列是平稳的则d=0,若一阶差分是平稳的则d=1,以此类推。
  2. 将平稳序列画出ACF,PACF图像,得出p,q值:p的值就是ACF第一次穿过上置信区间时的横轴值,q的值就是PACF第一次穿过上置信区间的横轴值(要对平稳时间序列分别求得其自相关系数ACF 和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q)
  3. 将得到的d,p,q带入求出ARIMA模型公式:通过数据拟合出模型的函数表达式(得到参数)
  4. 使用拟合的函数可以进行预测
    在这里插入图片描述
    示例图是一个例子中的ARIMA的函数图,蓝线是输入数据,红线是拟合的值,我们使用红线就可以预测出之后的值。
    但要注意此时的出的预测是一阶差分的预测,因此需要逆求出真实值。
    上述具体的例子:
    https://www.cnblogs.com/bradleon/p/6832867.html
一些细节

对ARIMA模型一个更简洁的表述:
在这里插入图片描述
链接:https://blog.csdn.net/chanbupt/article/details/70448147

AR自回归模型
是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型.
在这里插入图片描述
MA移动平均模型
MA模型和AR大同小异,它并非是历史时序值的线性组合而是历史白噪声的线性组合。与AR最大的不同之处在于,AR模型中历史白噪声的影响是间接影响当前预测值的(通过影响历史时序值)。
MA模型使用不同阶滞后的白噪音拟合。
在这里插入图片描述
白噪声的期望是0,方差为常数。
白噪声的定义:
对于一个随机变量X(t)(t=1,2,3……),如果是由一个不相关的随机变量的序列构成的,即对于所有s不等于t,随机变量X(t)和X(s)的协方差为零,则称其为纯随机过程。对于一个纯随机过程来说,若其期望为0,方差为常数,则称之为白噪声过程。

这篇关于时间序列数据挖掘--机器学习+统计学方法+kdd论文(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/923514

相关文章

JAVA中安装多个JDK的方法

《JAVA中安装多个JDK的方法》文章介绍了在Windows系统上安装多个JDK版本的方法,包括下载、安装路径修改、环境变量配置(JAVA_HOME和Path),并说明如何通过调整JAVA_HOME在... 首先去oracle官网下载好两个版本不同的jdk(需要登录Oracle账号,没有可以免费注册)下载完

Java中读取YAML文件配置信息常见问题及解决方法

《Java中读取YAML文件配置信息常见问题及解决方法》:本文主要介绍Java中读取YAML文件配置信息常见问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录1 使用Spring Boot的@ConfigurationProperties2. 使用@Valu

Java 方法重载Overload常见误区及注意事项

《Java方法重载Overload常见误区及注意事项》Java方法重载允许同一类中同名方法通过参数类型、数量、顺序差异实现功能扩展,提升代码灵活性,核心条件为参数列表不同,不涉及返回类型、访问修饰符... 目录Java 方法重载(Overload)详解一、方法重载的核心条件二、构成方法重载的具体情况三、不构

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

在Linux中改变echo输出颜色的实现方法

《在Linux中改变echo输出颜色的实现方法》在Linux系统的命令行环境下,为了使输出信息更加清晰、突出,便于用户快速识别和区分不同类型的信息,常常需要改变echo命令的输出颜色,所以本文给大家介... 目python录在linux中改变echo输出颜色的方法技术背景实现步骤使用ANSI转义码使用tpu

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP