prophet Uncertainty Intervals不确定性区间

2023-10-08 15:20

本文主要是介绍prophet Uncertainty Intervals不确定性区间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

例子代码

https://github.com/lilihongjava/prophet_demo/tree/master/uncertainty_intervals

# encoding: utf-8
"""
@author: lee
@time: 2019/8/6 9:22
@file: main.py
@desc: 
"""
from fbprophet import Prophet
import pandas as pddef main():df = pd.read_csv('./data/example_wp_log_peyton_manning.csv')df = df.loc[:180, ]  # Limit to first six monthsm = Prophet()m.fit(df)future = m.make_future_dataframe(periods=60)# 趋势的不确定性forecast = Prophet(interval_width=0.95).fit(df).predict(future)# 季节性的不确定性m = Prophet(mcmc_samples=300)forecast = m.fit(df).predict(future)fig = m.plot_components(forecast)fig.show()if __name__ == "__main__":main()

默认情况下,Prophet将返回预测返回值中yhat有不确定性区间。这些不确定性区间背后有几个重要的假设。

预测结果中存在三个不确定性来源:趋势的不确定性,季节性的不确定性以及额外的观测噪声。

趋势的不确定性

预测中最大的不确定性来源是未来趋势变化的可能性。我们在之前本系列文档中已经看到时间序列显示了历史上明显的趋势变化。prophet能够发现和拟合这些,但是我们应该期待哪些趋势会发生变化呢?我们无法确切地知道,所以我们尽我们所能做最合理的事情,并且假设我们未来看到的会与历史相似的趋势变化。特别是,我们假设未来趋势变化的平均频率和幅度与我们在历史上观察到的相同。 我们预测这些趋势变化并通过计算它们的分布来获得不确定性区间。

这种测量不确定度方法的一个特点是允许在速率上具有更高的灵活性,通过增加changepoint_prior_scale的值,将增加预测不确定性。 这是因为,如果我们对历史数据更多的速率变化进行建模,那么我们将对未来预测有更多的速率变化,并使不确定性区间成为过度拟合的有用指标。

可以使用以下interval_width参数(默认为80%)设置不确定区间的宽度:

# Python
forecast = Prophet(interval_width=0.95).fit(df).predict(future)

这些区间假设未来看到的与过去有相同的频率和幅度变化。这个假设可能不正确,所以不应该期望从这些不确定区间得到准确覆盖。

季节性的不确定性

默认情况下,Prophet只会返回趋势和观察噪声的不确定性。为了获得季节性的不确定性,必须进行完整的贝叶斯抽样。通过使用参数mcmc.samples(默认为0)来完成。以下使用快速入门中的Peyton Manning前六个月的数据:

# Python
m = Prophet(mcmc_samples=300)
forecast = m.fit(df).predict(future)

这里用MCMC采样取代最大后验估计,而且根据观测的数量,可能需要更长的时间---这里需要几分钟而不是原来几秒钟。如果进行完整采样,那么在绘制它们时,将看到季节性成分的不确定性:

# Python
fig = m.plot_components(forecast)

在Python中可以使用 m.predictive_samples(future)方法访问获取原始后验预测样本,或者在R语言中用 predictive_samples(m, future)

prophet使用的底层PyStan在Windows下中存在问题,这使得MCMC采样速度极慢。在Windows中使用MCMC采样的最佳选择是使用R语言来实现,如果选择用python实现,那么需要在Linux下。

 

参考资料:

https://facebook.github.io/prophet/docs/uncertainty_intervals.html

这篇关于prophet Uncertainty Intervals不确定性区间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/166232

相关文章

hdu 1754 I Hate It(线段树,单点更新,区间最值)

题意是求一个线段中的最大数。 线段树的模板题,试用了一下交大的模板。效率有点略低。 代码: #include <stdio.h>#include <string.h>#define TREE_SIZE (1 << (20))//const int TREE_SIZE = 200000 + 10;int max(int a, int b){return a > b ? a :

hdu4267区间统计

题意:给一些数,有两种操作,一种是在[a,b] 区间内,对(i - a)% k == 0 的加value,另一种操作是询问某个位置的值。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import

hdu4417区间统计

给你一个数列{An},然后有m次查询,每次查询一段区间 [l,r] <= h 的值的个数。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamRead

hdu3333区间统计

题目大意:求一个区间内不重复数字的和,例如1 1 1 3,区间[1,4]的和为4。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

【uva】11536-Smallest Sub-Array(区间移动问题)

一个区间移动的问题,1A了,感觉没什么好说的。。 13975926 11536 Smallest Sub-Array Accepted C++ 0.809 2014-08-01 11:00:20 #include<cstdio>#include<cstring>#include<iostream>using namespace std;#define INF 1 << 30

【hdu】Just a Hook(线段树区间修改)

线段树模板题,练的是懒惰标记。 懒惰标记,就是更新一段区间的时候,如果小区间被包含在了所需要更新的区间里面,那么直接对代表这个区间的数组元素赋值,之后做一个标记(表示这个区间的子区间都需要更新)但是不继续递归(这样可以节省很多的时候)。 116571152014-09-15 14:17:26Accepted1698796MS2380K1750 BG++KinderRiven #

【hdu】I Hate It(线段树,结点修改求区间最大值)

线段树的模板题,还是二分递归。 #include <iostream>#include <cstdlib>#include <cstdio>#include <string>#include <cstring>#include <cmath>#include <vector>#include <queue>#include <set>#include <map>#incl

【hdu】敌兵布阵(线段树,更加结点,区间求和)

最近开始刷线段树,主要围绕notonlysuccess的线段树总结刷。 结点修改还是比较简单的,不需要什么懒惰标记,直接二分递归就可以了。 #include <iostream>#include <cstdlib>#include <cstdio>#include <string>#include <cstring>#include <cmath>#include <vecto

ZOJ 3324 Machine(线段树区间合并)

这道题网上很多代码是错误的,由于后台数据水,他们可以AC。 比如这组数据 10 3 p 0 9 r 0 5 r 6 9 输出应该是 0 1 1 所以有的人直接记录该区间是否被覆盖过的方法是错误的 正确方法应该是记录这段区间的最小高度(就是最接近初始位置的高度),和最小高度对应的最长左区间和右区间 开一个sum记录这段区间最小高度的块数,min_v 记录该区间最小高度 cover

【Leetcode56】合并区间(数组 | 排序)

文章目录 一、题目二、思路三、代码 一、题目 二、思路 先将所有子列表按照start_pos进行排序,有利于保持顺序性,每次处理新子列表时,只用和结果列表ans_lst的最后一个子列表对比,如果有重合则合并,然后将合并的新子列表插入结果列表排序可以使用lambda函数,intervals.sort(key=lambda x: x[0])因为使用了sort,所以时间复杂度O(