首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
中性化专题
量化数据预处理:去极值、标准化、中性化
对于量化研究而言,拿到一份基础数据,首先需要对数据做预处理,以便于更好的探究数据规律,基于不同目标有不同处理环节,其中去极值、标准化、中性化这三点经常被放在一起讨论。整理网络资料,理解如下。 去极值 数据(单个因子的时间序列数据)中存在异常值,可能会导致拉大标准差、拉偏统计规律… 常规处理理念就是确定此数据指标(比如某个因子)的上下限阈值,然后超过(或低于)此限度的数据均设置为阈值,以提高数据
阅读更多...
pandas_市值中性化(例子)
题目: 1. 对2021-01-04的PB数据做市值中性化处理 概念: 1. 为什么需要中性化处理?什么时候用? 市值中性化是为了在因子选股回测的时候,防止选到的股票集中在固定的某些股票当中 1.1 市值影响 默认大部分因子当中都包含了市值的影响,所以当我们通过一些指标选择股票的时候,每个因子都会提供市值的因素,选择的股票比较集中,也就是选股的标准不太好 比如:市净率会与市值有很高的相
阅读更多...