ForecastPFN: Synthetically-Trained Zero-Shot Forecasting

2024-01-08 18:20

本文主要是介绍ForecastPFN: Synthetically-Trained Zero-Shot Forecasting,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ForecastPFN: Synthetically-Trained Zero-Shot Forecasting
2023.11.3 arxiv
论文下载
源码
ForecastPFN(Prior-data Fitted Networks)是zero-shot场景的:经过初始预训练后,它可以对一个全新的数据集进行预测,而没有来自该数据集的训练数据。

这个文章比较偏统计,可能涉及到先验、贝叶斯相关概念

PFN来源:TRANSFORMERS CAN DO BAYESIAN INFERENCE
2021年发表在ICLR上的文章
贝叶斯方法很难获得深度学习的好处,贝叶斯方法允许先验知识的明确规范和准确捕获模型的不确定性。我们提出先验数据拟合网络(PFN)。

摘要

绝大多数时间序列预测方法需要大量的训练数据集。然而,许多现实生活中的预测应用程序只有很少的初始观测值,有时只有40个或更少。因此,在数据稀疏的商业应用中的,大多数时间序列预测方法的适用性受到了限制。
(开篇说明课题背景:观测数据少)

虽然最近有些工作尝试在非常有限的初始数据设置下(“zero-shot"场景)做预测 ,由于预训练的数据不同,其性能也呈现出不一致性。

在我们的工作中,我们采用了一种不同的方法,并设计了ForecastPFN(prior-data fitted network),这是第一个纯粹基于新的合成数据分布训练的零样本预测模型。

ForecastPFN是一个先验数据拟合网络,经过训练以近似贝叶斯推理,可以在一次前向传递中对新的时间序列数据集进行预测。广泛的实验表明,与最先进的预测方法相比,ForecastPFN做出的零样本预测更准确、更快,即使当允许其他方法在数百个额外的分布内数据点上进行训练时也是如此。

处理数据集,合成数据集
在这里插入图片描述

贡献

  1. 引入ForecastPFN
  2. 实验,结果证明无需预训练,ForecastPFN也能表现得很好

介绍 FPN

巴拉巴拉一堆贝叶斯理论,先验后验,简单问题复杂化,得到第一步,先搞出一个合成的先验分布
,其实就是分解时间序列

Defining a Synthetic Prior for Time Series

时间序列值由三部分组成,trend,sezonal还有噪声zt,这个分解时按照乘法分解的,常见的分解方式还有加法分解

trend由线性成分和指数成分组成,包括四个参数 m l i n 、 m e x p 、 c l i n , c e x p m_{lin}、m_{exp}、c_{lin},c_{exp} mlinmexpclin,cexp四个参数

seasonal成分由周成分、月成分、年成分组成,各自对应参数 p w e e k , p m o n t h , p y e a r p_{week},p_{month},p_{year} pweek,pmonth,pyear

噪声 z t z_{t} zt服从均值为1的Weibull分布
在这里插入图片描述

ForecastPFN: a PFN for Zero-Shot Forecasting

  1. Architecture Details.
    使用transformer做为基础模型,现有的transformer模型通常用于预测next N steps,但本模型与之不同,而是输入一个随机的单一的时间查询,就能预测这个查询的输出。

  2. Robust Scaling.
    常规的归一化方式像z-score、最大最小归一化等归一化方式不再适用于模型,部分原因是前面的分解操作包括了乘法还有指数操作,这会导致数值变化大
    因此文章采用了一些措施来处理离群值:
    (1)屏蔽所有缺失值,(2)基于所有非离群值数据点(定义为2-sigma异常值)标准化数据(对落在2σ区间内的数据进行标准化),(3)剪除所有3-sigma离群值。

  3. Train Details
    一次离线训练,在一块Tesla V100 16GB GPU 上跑了30h

实验结果

只有Meta-N-BEATS和 ForeCastPFN模型是zero-shot,其他基线是非zero-shot的

在Data Budget=50和Data Budget=500情景下,将模型与基于统计学的模型(Arima、Last、Mean…)和基于transformer的模型(Autoformer、FEDFormer、Informer、Transformer)进行了对比,实验结果表示

DB=50,ETTh1、ETTh2、Weather
数据集下模型表现最优
DB=500,ETTh1,Weather数据集下表现最优
在这里插入图片描述

代码

tensorflow 不想读了,感觉读这篇文章花了好长时间,结果最后代码还是tensorflow的,有点亏

这篇关于ForecastPFN: Synthetically-Trained Zero-Shot Forecasting的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/584383

相关文章

uva 10061 How many zero's and how many digits ?(不同进制阶乘末尾几个0)+poj 1401

题意是求在base进制下的 n!的结果有几位数,末尾有几个0。 想起刚开始的时候做的一道10进制下的n阶乘末尾有几个零,以及之前有做过的一道n阶乘的位数。 当时都是在10进制下的。 10进制下的做法是: 1. n阶位数:直接 lg(n!)就是得数的位数。 2. n阶末尾0的个数:由于2 * 5 将会在得数中以0的形式存在,所以计算2或者计算5,由于因子中出现5必然出现2,所以直接一

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

速通GPT-3:Language Models are Few-Shot Learners全文解读

文章目录 论文实验总览1. 任务设置与测试策略2. 任务类别3. 关键实验结果4. 数据污染与实验局限性5. 总结与贡献 Abstract1. 概括2. 具体分析3. 摘要全文翻译4. 为什么不需要梯度更新或微调⭐ Introduction1. 概括2. 具体分析3. 进一步分析 Approach1. 概括2. 具体分析3. 进一步分析 Results1. 概括2. 具体分析2.1 语言模型

《Zero-Shot Object Counting》CVPR2023

摘要 论文提出了一种新的计数设置,称为零样本对象计数(Zero-Shot Object Counting, ZSC),旨在测试时对任意类别的对象实例进行计数,而只需在测试时提供类别名称。现有的类无关计数方法需要人类标注的示例作为输入,这在许多实际应用中是不切实际的。ZSC方法不依赖于人类标注者,可以自动操作。研究者们提出了一种方法,可以从类别名称开始,准确识别出最佳的图像块(patches),用

One-Shot Imitation Learning

发表时间:NIPS2017 论文链接:https://readpaper.com/pdf-annotate/note?pdfId=4557560538297540609&noteId=2424799047081637376 作者单位:Berkeley AI Research Lab, Work done while at OpenAI Yan Duan†§ , Marcin Andrychow

One-Shot Imitation Learning with Invariance Matching for Robotic Manipulation

发表时间:5 Jun 2024 论文链接:https://readpaper.com/pdf-annotate/note?pdfId=2408639872513958656&noteId=2408640378699078912 作者单位:Rutgers University Motivation:学习一个通用的policy,可以执行一组不同的操作任务,是机器人技术中一个有前途的新方向。然而,

class _ContiguousArrayStorage deallocated with non-zero retain count

Xcode报错 : Object 0x11c614000 of class _ContiguousArrayStorage deallocated with non-zero retain count 2. This object's deinit, or something called from it, may have created a strong reference to self w

零样本学习(zero-shot learning)——综述

-------本文内容来自对论文A Survey of Zero-Shot Learning: Settings, Methods, and Applications 的理解和整理,这里省去了众多的数学符号,以比较通俗的语言对零样本学习做一个简单的入门介绍,用词上可能缺乏一定的严谨性。一些图和公式直接来自于论文,并且省略了论文中讲的比较细的东西,如果感兴趣建议还是去通读论文 注1:为了方便,文中

【go-zero】win启动rpc服务报错 panic: context deadline exceeded

win启动rpc服务报错 panic: context deadline exceeded 问题来源 在使用go-zero生成的rpc项目后 启动不起来 原因 这个问题原因是wndows没有启动etcd 官方文档是删除了etcd配置 而我自己的测试yaml配置有etcd,所以需要启动etcd 下载安装好etcd后,在etcd的安装目录下,打开cmd,.\etcd 启动 然后

How to leverage pre-trained multimodal model?

However, embodied experience is limited inreal world and robot. How to leverage pre-trained multimodal model? https://come-robot.github.io/