本文主要是介绍20、【qlib】【其他组件/特性/主题】点时间(PIT)数据库,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
简介
在进行历史市场分析时,点时间(Point-in-Time,简称PIT)数据至关重要。
例如,在回测交易策略时,若使用过去五年历史数据作为输入,并假设模型每日在收盘时进行一次交易,我们需要在计算2020年1月1日的交易信号时,只能依据截至该时点的实际历史数据,即只包含2020年1月1日、2019年12月31日、2019年12月30日等日期的数据。
在金融数据领域,尤其是财务报告中,同一数据点可能多次修订。如果仅采用最新版数据进行历史回测,会导致数据泄露问题。点时间数据库正是为了解决这一问题,确保用户在任一历史时间戳都能获取准确的数据版本,进而保持线上交易与历史回测的一致性表现。
数据准备
Qlib 提供了一个爬虫工具,用于帮助用户下载金融数据,并通过转换器将其转化为Qlib格式。请遵循 scripts/data_collector/pit/README.md
中的指导进行数据下载和转换。另外,您还可以在其中找到一些额外的使用示例。
点时间数据的文件式设计
针对点时间数据,Qlib 提供了文件式的存储方案。
对于每个特征,数据文件包含四列:date(日期)、period(周期)、value(数值)以及 _next。每一行数据代表一条声明。
以文件名 XXX_a.data
为例,各列含义如下:
- date:声明发布日期
- period:声明所对应的周期
- 若为年度周期,
这篇关于20、【qlib】【其他组件/特性/主题】点时间(PIT)数据库的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!