量化投资之因子选取

admin 2025-09-07 阅读:4 评论:0
量化选股模型主要分为三大类:多因子选股、事件驱动选股以及基本面量化选股。 三种模型,都各有市场。本公众号主要关注于多因子选股(选债)和基本面量化选股(选债)。 因子是影响因素的简称。量化因子,是指对未来投资收益率具有正向作用的要素。...

量化选股模型主要分为三大类:多因子选股、事件驱动选股以及基本面量化选股。

三种模型,都各有市场。本公众号主要关注于多因子选股(选债)和基本面量化选股(选债)。

因子是影响因素的简称。量化因子,是指对未来投资收益率具有正向作用的要素。

因子选取,是量化投资的重要内容。

因子选取,应该具有内在的经济逻辑或者符合市场检验。

对价值投资者来说,盈利能力强、负债率低、价值低估的公司,股价未来收益率更高。这是基于经济逻辑。

对技术分析者而言,他们可能认为,股价在年线以上,未来赚钱概率大;股价在年线以下,未来赚钱概率小。这是基于市场经验的逻辑(但可能回测结果并不如意)。

一些券商研究了可转债成交量/换手率与未来收益率之间的关系,发现成交活跃的可转债,未来收益率更高,且相关系数在0.1左右。这是符合市场检验的逻辑。

有些程序员,回测了每周不同交易日进行可转债轮动的收益率(分组测试),发现周一调仓的收益率最高。调仓交易日和未来收益的相关性,具有内在的逻辑吗?这是个值得思考的问题。

不同的调仓日,和未来的收益率,可能具有相关性。只不过他们的内在逻辑关系,并不为我们所知而已。

不同的调仓日,和未来的收益率,也可能不具有相关性,而只是一种偶然。比如,分别以2015年1月的某个周一、2018年1月的某个周一作为起始日回测,一个是周一收益最好,一个是周一收益最差,那就说明回测收益存在由于选定的起始日不同而导致的偶然性。

今天,我们以身边的例子说明如何进行因子选取。

你认为,在初中阶段,语文、数学、英语、物理、化学,哪个科目与总成绩的相关性最大?

为研究这个问题,我利用某省会城市一个重点初中2020年第一次诊断考试的成绩,做了一个学科的相关性分析。

初中各学科(及与总分的)相关性分析

表中数据,表示每两个变量之间的相关性。

我们主要看最后一行的数据。

语文与总分的相关性系数为0.821,数学与总分的相关性系数为0.916,英语与总分的相关性系数为0.912,物理与总分的相关性系数为0.918,化学与总分的相关性系数为0.868。

排名:物理≈数学≈英语>化学>语文。

一个数学学得好的学生,其总成绩一般也会较好。

一个语文学得好的学生,其总成绩一般也会较好。

但是,数学相比语文,数学预测的准确性更高。这和我们生活中观察到的事实基本相符。

以上各学科与总成绩的相关性,即为量化投资中的“因子IC”。

与收益率相关性更高的因子,就是量化投资中要挖掘的量化因子。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

热门文章
  • BIAS指标解析:如何利用乖离率预测股价反转

    BIAS指标解析:如何利用乖离率预测股价反转
    乖离率(BIAS)是技术分析中一个重要的指标,用于衡量股价与其移动平均线之间的偏离程度。通过计算股价与均线的差值占均线的百分比,投资者可以判断当前股价是否处于超买或超卖状态。BIAS的计算公式为: BIAS = (当前股价 – 移动平均线) / 移动平均线 × 100% 当BIAS值大于10%时,通常认为股价处于超买状态,市场可能面临回调风险;而当BIAS值小于-10%时,则认为股价处于超卖状态,市场可能迎来反弹机会。 乖离率的基本原理 乖离率的核心思想是股价会围...
  • MACD指标解析:如何通过DIFF和DEA线捕捉市场趋势

    MACD指标解析:如何通过DIFF和DEA线捕捉市场趋势
    MACD(平滑异同移动平均线)是技术分析中常用的趋势跟踪指标,由DIFF线、DEA线和柱状线组成。它通过计算两条指数移动平均线(EMA)的差值,帮助投资者识别市场趋势的强弱和转折点。本文将深入解析MACD的构成、计算方法及其在捕捉趋势转折与背离信号中的应用。 MACD的构成与计算方法 MACD由三个主要部分组成:DIFF线、DEA线和柱状线。DIFF线是短期EMA(通常为12日)与长期EMA(通常为26日)的差值,反映了短期和长期趋势的差异。DEA线则是DIFF线的9...
  • CCI指标揭秘:如何利用CCI>100和CCI<-100捕捉买卖信号

    CCI指标揭秘:如何利用CCI>100和CCI<-100捕捉买卖信号
    顺势指标(Commodity Channel Index,简称CCI)是一种广泛应用于股票、期货和外汇市场的技术分析工具。它由唐纳德·兰伯特(Donald Lambert)于1980年提出,主要用于衡量价格相对于其统计平均值的偏离程度。CCI的核心思想是通过计算当前价格与历史平均价格的差异,来判断市场是否处于超买或超卖状态。 CCI的计算公式较为复杂,但其核心逻辑是通过比较当前价格与一定周期内的平均价格,来衡量价格的波动性。具体来说,CCI的计算公式为:CCI = (当...
  • 能量潮(OBV)揭秘:如何通过成交量预测股价趋势

    能量潮(OBV)揭秘:如何通过成交量预测股价趋势
    能量潮(On-Balance Volume,简称OBV)是一种技术分析工具,由乔·格兰维尔(Joe Granville)在1963年提出。OBV通过累计成交量的变化来预测股票价格趋势,是一种非常有效的量价分析工具。OBV的核心思想是成交量是价格变动的先行指标,成交量的变化可以预示价格的未来走势。 OBV的计算方法相对简单。当某一天的收盘价高于前一天的收盘价时,当天的成交量被加到前一天的OBV值上;当某一天的收盘价低于前一天的收盘价时,当天的成交量从前一天的OBV值中减去...
  • 2025全球先锋赛循环赛第一日赛程预告:19点HLE对战TES

    2025全球先锋赛循环赛第一日赛程预告:19点HLE对战TES
      2025全球先锋赛循环赛第一日赛程预告(BO3):   16:00 KC对战TL   约19:00 HLE对战TES   解说:王多多、鼓鼓、Wayward   主持:泱泱...