本文主要是介绍研报笔记:光大证券多因子系列1-3,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
-
(一)因子测试框架2017.4.10
根据现代金融理论的定义,投资组合获取的收益分为两部分:来自市场的收益(Beta) + 超出市场的收益(Alpha)。
获取Alpha的理论有:资本资产定价模型(CAPM)、Fama-French三因素模型、基于套利定价理论(APT)的多因子模型。
多因子模型从构建目标角度分为:
-
从CAPM到MFM
-
CAPM
在资产组合理论的基础上发展(1964)而来:
E ( r p ) = r F    +    β p ∗ ( r M    −    r F ) E(r_p)=r_F \; + \; \beta_p*(r_M\; - \; r_F) E(rp)=rF+βp∗(rM−rF)
r p r_p rp资产 p p p的收益率;r F r_F rF无风险收益率;
r M r_M rM市场基准收益率;
β p = C o v ( r p , r M ) V a r ( r M ) \beta_p=\frac{Cov_(r_p,r_M)}{Var(r_M)} βp=Var(rM)Cov(rp,rM)资产收益率与市场组合收益率之间的协方差除以市场组合收益率方差;
CAPM中,资产收益率 r p r_p rp只取决于 β p \beta_p βp,又因为 β p \beta_p βp的定义,因此可以看作是以***市场组合为因子***的单因子模型。
-
Fama-French
Fama/French(1992)基于PB、市值因子对股票收益率的贡献建立***Fame-Frech三因素***模型。
-
APT
APT模型根据无套利原则,得到风险资产均衡收益与多个因子之间存在近似线性关系,将影响资产收益的因子从CAPM(单因子)&Fama-French(三因子)拓展到***多个因子***,也就为多因子模型的发展奠定了基础。
-
MFM
多因子模型(MFM)理解为:将N只股票的收益率分解为M个因子的线性组合与未被因子解释的残差项。
r i = β i 1 ∗ f 1    +    β i 2 ∗ f 2    +    β i 3 ∗ f 3    + . . .    +    β i M ∗ f M    +    μ i r i = ∑ j = 1 M β i j ∗ f j + μ i r_i=\beta_{i1}*f_1\;+\;\beta_{i2}*f_2\;+\;\beta_{i3}*f_3\;+...\;+\;\beta_{iM}*f_M\;+\; \mu_i \\r_i=\sum^M_{j=1}\beta_{ij}*f_j+\mu_i ri=βi1∗f1+βi2∗f2+βi3∗f3+...+βiM∗fM+μiri=j=1∑Mβij∗fj+μi
β i j \beta_{ij} βij股票 i i i在因子 j j j上的因子暴露(factor loading),又称为敏感度,就是权重;f j f_j fj因子收益;
μ i \mu_i μi股票 i i i的残差收益;
假设前提:
- μ i \mu_i μi之间两两相互独立。不同股票之间的收益率的相关性只取决于M个因子 f j f_j fj;
- 残差收益率 μ i \mu_i μi与各个因子间不存在相关性;
相比于CAPM和Fama-French模型,MFM可以提供更为完整的风险暴露分析,并分理处每个因子的影响,从而为投资绝测提供更为局部细致的分析。
-
-
多因子模型的构建流程
-
数据源
获取数据并做相应清洗。(ST股票、停牌股票、异常值、缺失值、PT股票…)
关键字: 3 σ 3\sigma 3σ去极值法、MAD(Median Absolute Deviation绝对中位数法)、中信一级行业、异常值缺失值剔除或替换、因子标准化(Z值标准化(Z-Score)、Rank标准化、风格标准化)
-
单因子挖掘
-
单因子测试
-
单因子回归模型
相比于全样本面板回归(Panel Data Regression),截面回归(Cross-Section Regression)更有利于对因子变化趋势的捕捉,因此常为业界采用。
I t i u I_{tiu} Itiu哑变量(Dummy Variable):股票术语某个行业则该股票在该行业的因子暴露等于1,在其他行业的因子暴露等于0.
-
回归模型选择
最小二乘法(OLS)、WLS(Weighted Least Square)、RLM(Robust Linear Model)
-
单因子有效性检验
指标:因子收益序列 f i f_i fi的假设检验 t t t值、因子收益序列 f i f_i fi大于0的概率、 t t t值绝对值的均值、 t t t值绝对值大于等于 2 的概率.
IC值(信息系数)是指个股第t期在因子i上的因子暴露(剔除行业于市值后)与t+1期的收益率的相关系数。
IC值计算方法有:相关系数(Pearson Correlation)、秩相关系数(Spearman Rank Correlation)
与IC值相关的判断因子有效性和预测能力的指标:IC值的均值、IC值的标准差、IC大于0的比例、IC绝对值大于0.02的比例、IR(IR = IC均值/IC标准差)。
观察因子的单调性只能通过分层回溯的方法。
基准关键字:中证全指指数、沪深300、中证500、中证800、中证1000
表现指标:年化绝对收益、年化相对收益、累计绝对收益、累计相对收益、年化波动、夏普比、最大回撤、最大相对回撤、信息比…
-
-
消除因子之间的多重共线性
- 在同类因子的共线性较大的几个因子中,保留有效性最高的因子,剔除剩余因子;
- 因子组合:方法包括等权甲醛、以因子收益 f f f为权重甲醛、PCA主成分分析;
- 暴力迭代法,将因子两两组合暴力迭代得到表现最好的组合方法;
在对因子集做残差的异方差分析处理后,就可以进行多元线性回归,估计每期的因子收益序列。
-
(二)因子测试全集2017.4.28
上篇报告中,构造了一个全面的基于RLM稳健回归的界面回归单因子测试框架,并整理了包括估值因子、规模因子、成长因子、质量因子、杠杆因子、动量因子、波动因子、技术因子、流动性因子、分析师因子等10个大类100多个细分因子。
本报告给出对于众多因子基于:预测性、稳定性、单调性、相关性等指标的评测。
-
(三)多因子组合“广大Alpha 1.0”2017.5
前两篇报告,构造了一个全面的基于RLM稳健回归的截面回归单因子测试框架,并整理了各类因子评测。
本报告基于上述结论筛选因子并构建多因子组合。
-
因子的初步筛选
从10个打雷中筛选出收益率较显著,高IC、IR并且单调性得分较高的44个因子。
-
因子权重的优化-基于因子IC
基于Qian的《Quantitatice Equity Portfolio Management》一书所提出的基于因子IC序列以及IC协方差矩阵构造的最优化IR多因子模型。
-
广大多因子组合:“光大Alpha1.0”
在Wind的PMs组合管理模块中搜索光大金工即可以找到此组合。
- 《多因子系列报告之一:因子测试框架》
- 《多因子系列报告之二:因子测试全集》
- 《多因子系列报告之三:多因子组合“光大 Alpha 1.0”》
这篇关于研报笔记:光大证券多因子系列1-3的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!