风险提示:理性看待区块链,提高风险意识!
用多因子策略构建强大的加密资产投资组合:因子合成篇
首页 > 业界 > 区块链 2024-02-06 21:58
摘要
书接上回,关于《用多因子模型构建强大的加密资产投资组合》系列文章中,我们已经发布了三篇:《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》 。
币界网报道:

一、因子相关性检验的原因:多重共线性

我们通过单因子测试部分筛选出一批有效因子,但以上因子不能直接入库。因子本身可以根据具体的经济含义进行大类划分,同类型的因子间存在较强的相关性,若不经相关性筛选直接入库,根据不同因子进行多元线性回归求预期收益率时,会出现多重共线性问题。计量经济学中,多重共线性是指回归模型中的一些或全部解释变量存在“完全”或准确的线性关系(各变量间高度相关)。

因此,有效因子筛选出后,首先需要根据大类对因子的相关性进行T检验,对于相关性较高的因子,要么舍弃显著性较低的因子,要么进行因子合成。

多重共线性的数学解释如下:

Y=β₁+β₂X₂ᵢ+β₃X₃ᵢ+…+βₖXₖᵢ+μᵢ,i=1,2,…,n

会存在两种情况:

1.C₂X₂ᵢ+C₃X₃ᵢ+…+CₖXₖᵢ=常数向量,Cᵢ不全为0→Xᵢ 间存在完全共线

2.C₂X₂ᵢ+C₃X₃ᵢ+…+CₖXₖᵢ+Vᵢ=常数向量,Cᵢ不全为0,Vᵢ为随机误差项,→Xᵢ间存在完全共线

多重共线性导致的后果:

1.完全共线性下参数估计量不存在

2.近似共线性下OLS估计量非有效

我们首先定义方差膨胀因子(variance- inflating factor, VIF)为 VIF=1/(1−rᵢⱼ) ,指参数估计量的方差由于出现多重共线性而膨胀,随着相关系数增加,VIF显著增加。

以二元线性模型为例:Y=β₁+β₂X₂ᵢ+β₃X₃ᵢ+μᵢ用多因子策略构建强大的加密资产投资组合:因子合成篇

相关系数的平方和

用多因子策略构建强大的加密资产投资组合:因子合成篇

  • 完全不共线(完全不相关):

用多因子策略构建强大的加密资产投资组合:因子合成篇

  • 近似共线:

 

用多因子策略构建强大的加密资产投资组合:因子合成篇

,越接近1,方差↑

  • 完全共线:

用多因子策略构建强大的加密资产投资组合:因子合成篇

,方差无限大

3.参数估计量经济含义不合理

4.变量的显著性检验(t检验)失去意义

5.模型的预测功能失效:通过多元线性模型拟合出的预测收益率极其不准确,模型失效。

二、步骤一:同类型因子的相关性检验

检验新求出的因子与已入库因子的相关性。通常来说,有两类数据求相关性:

1.根据所有token在回测期间的因子值求相关

2.根据所有token在回测期间的因子超额收益值求相关

超额收益=多头组收益−基准收益,收益=ln(closeₜ/close₋₁)

我们所求的每个因子对token的收益率都有一定的贡献和解释能力。进行相关性检验**,是为了找到对策略收益有不同解释和贡献的因子,策略的最终目的是收益**。如果两个因子对收益的刻画是相同的,即使两个因子值存在很大差别也无意义。因此,我们并不是想找到因子值本身差异大的因子,而是想找到因子对收益刻画不同的因子,所以最终选择了用因子超额收益值求相关。

我们的策略是日频,所以按回测区间的日期计算因子超额收益之间的相关系数矩阵

用多因子策略构建强大的加密资产投资组合:因子合成篇

编程求解与库内相关最高的前n个因子:

def get_n_max_corr(self, factors, n=1):

factors_excess = self.get_excess_returns(factors)

save_factor_excess = self.get_excess_return(self.factor_value, self.start_date, self.end_date)

        if len(factors_excess) < 1:

return factor_excess, 1.0, None factors_excess[self.factor_name] = factor_excess['excess_return']

factors_excess = pd.concat(factors_excess, axis=1)

factors_excess.columns = factors_excess.columns.levels[0] # get corr matrix

factor_corr = factors_excess.corr()

factor_corr_df = factor_corr.abs().loc[self.factor_name]

max_corr_score = factor_corr_df.sort_values(ascending=False).iloc[1:].head(n)

return save_factor_excess, factor_corr_df, max_corr_score

三、步骤二:因子取舍、因子合成

对于相关性较高的因子集合,可以采取两种方式处理:

(1)因子取舍

根据因子本身的ICIR值、收益率、换手率、Sharpe 比率,挑选某维度下最有效的因子进行保留,删除其他因子。

(2)因子合成

对因子集合中的因子进行合成,截面上尽可能多的保留有效信息

F=w₁∗f₁+w₂∗f₂+…+wₙ∗fₙ,F为最终的合成因子,f为需要进行合成的因子

假设当前有3个待处理的因子矩阵:

synthesis = pd.concat([a,b,c],axis = 1) 

synthesis

a b c

BTC.BN 0.184865 -0.013253 -0.001557

ETH.BN 0.185691 0.022708 0.031793

BNB.BN 0.242072 -0.180952 -0.067430

LTC.BN 0.275923 -0.125712 -0.049596

AAVE.BN 0.204443 -0.000819 -0.006550

... ... ... ...

SOC.BN 0.231638 -0.095946 -0.049495

AVAX.BN 0.204714 -0.079707 -0.041806

DAO.BN 0.194990 0.022095 -0.011764

ETC.BN 0.184236 -0.021909 -0.013325

TRX.BN 0.175118 -0.055077 -0.039513

2.1 等权加权

各因子权重相等(w=1/因子个数),综合因子=各因子值加总求平均。

Eg.动量类因子,一个月收益率、两个月收益率、三个月收益率、六个月收益率、十二个月收益率,这六个因子的因子载荷各占1/6的权重,合成新的动量因子载荷,然后再重新进行标准化处理。

synthesis1 = synthesis.mean(axis=1) # 按行求均值

2.2 历史IC加权、历史ICIR、历史收益加权

用回测期的IC值(ICIR值、历史收益值)对因子进行加权。过去有很多期,每一期都有一个IC值,所以用它们的均值作为因子的权重。通常使用回测期IC的均值(算数平均值)作为权重。

# 权重归一化(后文中的因子加权方式也基本都需要进行权重归一化)

w_IC = ic.mean() / ic.mean().sum()

w_ICIR = icir.mean() / icir.mean().sum()

w_Ret = Return.mean() / Return.mean().sum()

synthesis2 = (synthesis * w_IC).sum(axis=1)

synthesis2 = (synthesis * w_ICIR).sum(axis=1)

synthesis2 = (synthesis * w_Ret).sum(axis=1)

2.3历史IC半衰加权、历史ICIR半衰加权

2.1与2.2都是计算算数平均值,回测期的每一次IC、ICIR对于因子的作用被默认为相同。

但现实中,回测期的每一期对于当期的影响程度不完全相同,存在时间上的衰减。越接近当前期的时期,影响越大,越远影响越小。在此原理,求IC权重前首先定义一个半衰权重,距离当期越近的权重值越大、越远权重越小。

半衰权重数学推导:用多因子策略构建强大的加密资产投资组合:因子合成篇

* 半衰期H:每向前推H期,权重值以指数下降的方式降低一半* T:考虑回测的期数

# 半衰权重

def Decay(H,T):

t = np.arange(T+1)[1:]

wt = 2**((t-T-1)/H) #半衰权重

decay = wt/wt.sum() #归一化

return decay

# 历史IC半衰加权

w_bs = Decay(6,12) # 假设T=12,H=6

ic_bs = ic.mul(w_bs,axis=0)

w = ic_bs.mean()/ic.mean().sum()

synthesis3 = (synthesis * w).sum(axis=1)

# 历史ICIR半衰加权

# 历史ICIR半衰加权在历史IC半衰加权的基础上,除以IC值的标准差。

w_bs = bs(6,12)

ic_bs = ic.mul(w_bs,axis=0)

ir_bs = ic_bs.mean()/ic.std()

w = ir_bs.mean()/ir_bs.mean().sum()

synthesis3 = (synthesis * w).sum(axis=1)

2.4 最大化ICIR加权

通过求解方程,计算最优因子权重w使得ICIR最大化

 

用多因子策略构建强大的加密资产投资组合:因子合成篇

协方差矩阵的估计问题:协方差矩阵用于衡量不同资产之间的关联性。统计学中常以样本协方差矩阵代替总体协方差矩阵,但在样本量不足时,样本协方差矩阵与总体协方差矩阵的差异会很大。所以有人提出了压缩估计的方法,原理是使估计协方差矩阵与实际协方差矩阵之间的均方误差最小

方式:

1.样本协方差矩阵

# 最大化ICIR加权(样本协方差)

ic_cov = np.array(ic.cov())

inv_ic_cov = np.linalg.inv(ic_cov)

ic_vector = np.mat(ic.mean())

w = inv_ic_cov * ic_vector.T

w = w / w.sum()

synthesis4 = (synthesis * pd.DataFrame(w,index=synthesis.columns)[0]).sum(axis=1)

2.Ledoit-Wolf收缩:引入一个缩小系数,将原始的协方差矩阵与单位矩阵进行混合,以减少噪音的影响。

# 最大化ICIR加权(Ledoit-Wolf压缩估计协方差)

from sklearn.covariance import LedoitWolf

model=LedoitWolf()

model.fit(ic)

ic_cov_lw = model.covariance_

inv_ic_cov = np.linalg.inv(ic_cov_lw)

ic_vector = np.mat(ic.mean())

w = inv_ic_cov*ic_vector.T

w = w/w.sum()

synthesis4 = (synthesis * pd.DataFrame(w,index=synthesis.columns)[0]).sum(axis=1)

3.Oracle近似收缩:对Ledoit-Wolf收缩的改进,目标是通过对协方差矩阵进行调整,从而在样本大小较小的情况下更准确地估计真实的协方差矩阵。(编程实现与Ledoit-Wolf收缩同理)

2.5 主成分分析PCA

主成分分析(Principal Component Analysis,PCA)是一种用于降维和提取数据主要特征的统计方法。其目标是通过线性变换,将原始数据映射到一个新的坐标系,使得数据在新坐标系下的方差最大化。

具体而言,PCA首先找到数据中的主成分,也就是数据中方差最大的方向。然后,它找到与第一个主成分正交(无关)且具有最大方差的第二个主成分。这个过程一直重复,直到找到数据中所有的主成分。

# 主成分分析(PCA)

from sklearn.decomposition import PCA

model1 = PCA(n_components=1)

model1.fit(f)

w=model1.components_

w=w/w.sum()

weighted_factor=(f*pd.DataFrame(w,columns=f.columns).iloc[0]).sum(axis=1)

发表评论
发表评论
暂无评论
    相关阅读
    币界百科
    币界资讯
    美国司法部 (DOJ) 正在对价值超过 2.25 亿美元的加密货币提起民事没收诉讼。
    区块链
    2025-06-20 06:22:46
    DOT 价格在 3.50 美元左右摇摆不定——鲸鱼投资者会乘机将其推高至 30 美元,还是会让它跌破底线?
    区块链
    2025-06-20 06:15:03
    散户可能正在抛售,但巨额投资者和长期持有者正在收紧流通股。
    比特币
    2025-06-20 05:56:26
    稀缺性日益加剧,比特币正在消失。比特币独特的供应曲线能否颠覆传统的市场预期?
    比特币
    2025-06-20 05:06:54
    与特朗普有关联的实体 DT Marks DEFI LLC 已减少其在 DeFi 公司 World Liberty Financial 的多数股权。
    区块链
    2025-06-20 04:17:36
    在当今数字化浪潮席卷的时代,GTAI平台宛如一颗璀璨的新星,吸引着众多目光。它究竟有着怎样的独特魅力和神秘之处呢?本文将带你深入探索GTAI平台,详细剖析其核心功能、优势特点以及应用场景。无论是对于新手小白想要了解新兴平台,还是资深从业者寻求新的机遇,这篇文章都将为你提供全面且有价值的信息,让你对GTAI平台有更清晰的认知。
    区块链书籍
    2025-03-07 21:03:51
    在加密货币的世界里,IDRT合约成为了近期热议的焦点。很多投资者和爱好者都对其充满了好奇与疑惑。本文将深入剖析IDRT合约,详细介绍它的特点、应用场景以及可能面临的风险。通过专业的分析和解读,帮助大家更好地了解这一合约,在加密领域做出更明智的决策。无论你是新手小白,还是资深玩家,都能从中获得有价值的信息。
    区块链书籍
    2025-03-07 20:41:36
    在加密货币交易的热潮中,RIZO交易所吸引了众多投资者的目光。很多人都急切地想知道RIZO交易所官网的具体信息。本文将深度剖析如何找到RIZO交易所官网,为你解决在寻找官网过程中遇到的疑惑,让你能顺利开启在RIZO交易所的交易之旅,不再为寻找官网而烦恼。
    区块链百科
    2025-03-07 18:17:56
    你是否对STRK交易平台充满好奇?STRK属于Layer 2扩展解决方案,在零知识证明技术领域表现出色。其使用的ZK - STARK技术优于传统的ZK - Rollup,交易处理高效且安全隐私有保障。背后的StarkWare团队由密码学专家领导,还获得顶级风投支持。STRK总供应量为100亿枚,有着独特的代币分发与锁仓机制。想深入了解这个潜力巨大的交易平台,就别错过!
    矿业百科
    2025-03-07 15:47:50
    在加密货币领域,TLM交易平台和JUPa合约正逐渐成为焦点。TLM币作为Alien Worlds项目代币,在虚拟世界中具有质押、平台治理、游戏货币、购买NFT等多种用途。而JUPa合约相关信息虽未详细阐述,但在加密创新不断涌现的当下,其也备受关注。想深入了解TLM交易平台和JUPa合约在加密市场的表现与潜力,快来一探究竟。
    交易所百科
    2025-03-07 11:34:48
    近期,瑞波币在加密货币市场中表现极为亮眼,呈现出飙升的态势,吸引了众多投资者和业内人士的高度关注。瑞波币于2012年推出,旨在为跨境支付提供快速、低成本的解决方案。其此次飙升并非偶然,背后有着多种因素的推动。一方面,Ripple公司持续优化区块链技术,提升了交易速度和安全性;另一方面,越来越多传统金融巨头接纳并采用瑞波币,增强了市场信心。此外,全球对数字货币接受度的提高,以及其在跨境支付领域的突破性进展,也为其价值带来质的飞跃。然而,加密货币市场本质上风险较高,市场情绪变化和政策环境的不确定性都可能对瑞波
    区块链知识
    2025-03-03 19:53:56
    在虚拟货币的江湖中,排名时刻都在发生变化。虚拟货币的价值受市场情绪、技术发展、投资趋势等多种因素影响。今天为大家揭秘2025虚拟货币排行榜前十名。其中,比特币作为最早的加密货币,一直是数字货币市场的领头羊;以太坊不仅是一种货币,还提供了开发去中心化应用和智能合约的平台;莱特币则以更快的交易确认时间受到用户欢迎。此外,瑞波币、卡尔达诺、波卡等也各有特色。它们的市值和排名可能会随着市场的变化而波动,想要深入了解虚拟货币领域,就持续关注其动态吧!
    交易所知识
    2025-03-03 18:01:30
    近期加密货币市场可谓是风云变幻,特朗普币更是成为焦点。此前特朗普宣布加密货币战储标的等消息曾引发市场剧烈波动,比特币暴涨超10%,以太坊涨逾14%,特朗普币更是暴涨逾30%,超17万人爆仓。然而,如今特朗普币爆仓,这背后有着多方面因素。一方面美联储“鹰派”表态带来不确定性,费城联储主席哈克称关税或贸易战可能导致通胀等,且很多事情取决于特朗普政府政策细节,美联储应保持利率不变;另一方面,Bybit黑客入侵事件加剧了市场波动,黑客窃取超15亿美元加密货币。特朗普币爆仓究竟会给加密货币市场带来怎样的后续影响,值
    币种知识
    2025-03-03 17:45:07
    在加密货币市场不断发展的今天,PROM杠杆与ISLM交易平台成为了众多投资者关注的焦点。PROM作为驱动Prom生态系统的原生代币,其杠杆交易模式为市场带来了更多的可能性。此前币安曾上线PROMUSDT永续合约,最高支持75倍杠杆。而ISLM交易平台在市场中也有着独特的地位,它为投资者提供了丰富多样的交易选择。对于投资者来说,了解PROM杠杆的特点和ISLM交易平台的规则,有助于更好地制定投资策略,在加密货币的浪潮中把握机遇,实现自己的投资目标。深入研究这两者,能够帮助投资者在复杂多变的市场环境中做出更明
    交易所知识
    2025-03-04 09:45:51
    2025年加密货币市场预计将再次迎来增长爆发。有四大加密货币值得关注。Dogecoin作为最早的迷因币,拥有强大社区支持,且历史上有大幅增长潜力,其项目基金会通过创新举措扩展了实用性,在2024年8月12日至12月12日期间价格上涨300%,为2025年牛市周期开了好头。Solana以可扩展性、速度和低交易成本著称,已成为迷因币项目热门目的地,随着迷因代币动力增强,对其代币需求增加或致价格飙升。XRP因投资者信心恢复和积极事件,市值重返前三,未来潜力巨大。新兴迷因币SPX6900凭借有趣概念和熊市韧性脱颖
    币种知识
    2025-03-03 17:11:19
    推荐专栏
    Boss Wallet Web3 Econom Pass
    去中心化交易所
    一位相信价值投资的币圈KOL。稳定盈利的缠论野生交易员 #BTC行情分析师 #价值投资 #链上数据分析
    爱Web 3,爱生活,爱科技,爱炒币的老韭菜
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    104,663.95 USDT
    ¥752,219.80
    -0.17%
    ETH以太坊
    2,520.93 USDT
    ¥18,117.92
    -0.03%
    USDT泰达币
    0.99980 USDT
    ¥7.19
    -0.02%
    XRP瑞波币
    2.17 USDT
    ¥15.56
    -0.17%
    BNB币安币
    644.60 USDT
    ¥4,632.74
    -0.01%
    SOL
    146.99 USDT
    ¥1,056.41
    +0.51%
    USDC
    0.99960 USDT
    ¥7.18
    0%
    TRX波场币
    0.27470 USDT
    ¥1.97
    +0.66%
    DOGE狗狗币
    0.17080 USDT
    ¥1.23
    +0.12%
    ADA艾达币
    0.60200 USDT
    ¥4.33
    -0.2%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    比特币
    104666.76 USDT
    ¥761,974.01
    -0.17%
    Uniswap
    7.6818 USDT
    ¥55.92
    +1.53%
    Filecoin
    2.3461 USDT
    ¥17.08
    -1.74%
    柚子
    0.5006 USDT
    ¥3.64
    -1.34%
    波场
    0.2748 USDT
    ¥2.00
    +0.7%
    Arweave
    5.3737 USDT
    ¥39.12
    +0.04%
    OK币
    52.4527 USDT
    ¥381.86
    +9%
    狗狗币
    0.1708 USDT
    ¥1.24
    +0.12%
    Curve
    0.5892 USDT
    ¥4.29
    -1.26%
    Solana
    147.02 USDT
    ¥1,070.31
    +0.53%
    币安币
    644.6 USDT
    ¥4,692.69
    -0.01%
    dYdX
    0.5096 USDT
    ¥3.71
    +0.35%
    最新快讯
    更多
    TikTok:声称TikTok的所有者正在购买“特朗普币”的说法纯属捏造且极不负责
    2025-06-20 07:41:10
    以太坊开放利息创新高,或迎来类似比特币的牛市突破
    2025-06-20 07:01:16
    Renzo与Concrete达成战略合作,在Eigenlayer上推出机构再质押金库
    2025-06-20 06:49:54
    美联储7月维持不变的概率为91.7%
    2025-06-20 06:42:34
    AbstractChain官方推特疑似被盗,发布虚假代币信息
    2025-06-20 06:17:30
    SemlerScientific计划于2027年底持有10.5万枚比特币,任命JoeBurnett负责比特币战略
    2025-06-20 05:09:23
    BCHUSDT现报价496.5美元,24小时涨幅达8%
    2025-06-20 04:19:02