本文主要是介绍基于Rstudio的时间序列预测和计算(第一节),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
引言:
时间序列,又称动态数列。顾名思义,是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。涉及应用的领域非常广泛,譬如机器学习,统计学,数学建模等等。这篇文章将会以R中自带的康涅狄格州纽黑文地区从1912年到1971年每年的平均气温数据集(nhtemp)为例,进行时间序列的预测和计算。
1.数据的转化
在我们进行对时间序列的预测和计算之前,我们要清楚:我们手里的数据是来自数据集的,或者是通过不同的统计平台获取的,他们还不是对象,需要转化,R里的与时间序列有关的很多库函数,如HoltWinters()函数,ets()函数等对参数的要求都是有严格的标准的,必须是时序对象才能使这些函数正确运行,那么转化的代码如下:
nhtemp1<-ts(nhtemp,frequency=12,start=c(1912,2),end=c(1912,12)) %对nhtemp数据集进转化
上面这行代码就把nhtemp转化成了一个时序对象,并把其储存在nhtemp1中,frequency,start,end都是参数,根据自己的需要进行增删:
frequency:顾名思义是频率,周期的意思。直观地来说就是你使用时间序列时你自己定义的后面要进行差分,统计等等动作的周期。
start,开始,我们需要使用定义向量的函数c()来定义序列起始位置的日期,上面这个意思就是用建立向量的方式定义目标数据的开头的时间是1912年2月。
end,结束,用法和start一样。值得注意的是,start和end可以用于对数据集取子集,十分好用。
2.基于Rstudio的各种操作
作为一门高级可视化分析的语言,工具。很明显在我们读取完数据后,很常见的操作就是绘图,这也是R语言相较于其他数学建模工具的一个很鲜明的特点:高级可视化统计分析(小编的体会)。
2.1对时间序列对象的绘图
我们可以使用下面这些命令,对前面的数据集进行绘图(两者在效果上是等效的):
plot(nhtemp1) %对已经转化的数据,就已经是时间序列对象直接执行画图
plot.ts(nhtemp)_ %使用plot.ts
这篇关于基于Rstudio的时间序列预测和计算(第一节)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!