为您找到相关结果约1

  • 基于秩相关性与专家经验的基本面先行指标筛选法【SMM分析】

    摘要 我们基于秩相关性分析法与专家经验分析法对基本面先行指标进行筛选。我们选用了相关性分析法中的斯皮尔曼等级相关系数(Spearman’s Rank Correlation Coefficient)对电解铝和氧化铝的月度平衡、进出口和成本利润数据进行前瞻性分析。通过量化分析,我们发现利润、成本和价格对产量、进口和消费量的提前相关性较高,但是也发现某些先行指标并不能明确地解释产业逻辑。结合基本面分析,我们最终综合地得出10条稳定性和解释性较强的先行指标。我们通过两种传统分析法,结合出了新的先行指标筛选流程。 基本面先行指标的重要性 我们认为引入相对“微观”和提前周期更短的基本面先行指标将有利于决策者对未来经济的潜在变化做出更加全面的应对策略。经济指标大体分为先行指标、同步指标和滞后指标。目前先行指标注重于相对“宏观”和提前周期更长的经济指标。世界大型企业联合会领先经济指标指数先行指标主要围绕相对“宏观”的消费者期望、建筑许可和信贷条件提前6到9个月对未来经济活动进行指导,这些指标在宏观上能帮助使用者对经济扩张与萧条进行预判(The Conference Board, 2023)。但是,对于周期更短(提前周期小于20周)更微观(进出口、利润、消费量、库存等)的提前指导需求宏观先行指标很难满足。我们引入的基本面先行指标将能满足提前周期更短和更微观的需求,并且我们发现基本面先行指标与常规的先行指标一样具有“先行指标通常(但并非总是)在整体经济发生变化之前发生变化”的特性(O'Sullivan, Arthur; Sheffrin, Steven M., 2003)。 此外,先行指标对于有效的决策制定和风险管理至关重要。在企业决策方面,基本面先行指标可以帮助企业经理预测未来的经济活动,包括行业的消费情况、供需平衡、增长与衰退。先行指标提供了能及时做出调整的数据参考,允许决策者在市场变化之前及时采取行动。在风险与投资方面,基本面先行指标可以指示市场潜在方向,帮助生产者有效地规划投资、生产和库存管理,从而达到避险效果。对于大宗商品期货投资者而言,由于期货为现货价格未来的期望,稳定的基本面先行指标可以为期货投资者提供建议。 先行指标筛选方法 我们基于相关性分析法并结合专家经验,筛选出基本面先行指标。由于需要测试基本面数据在先行周期的单调递增性,所以我们通过统计不同指标间的斯皮尔曼等级相关系数(下文统一用Spearman Coe代替)进行预测指标走向。Spearman Coe具有非参数性质;当两个变量排名间都符合单调递增时,单调函数将输出1。反观皮尔逊相关系数,两变量的值之间呈现完美相关时,线性函数才会输出1。由于基本面数据在采集时可能会出现与历史数据一致的样本,如果在数值相同时,排列序数继续增加,那么此时并不能反映排名的真实性,所以我们需要引入波达计数法(Borda Count)对分数排名进行计算并保持所有分数排名之和与排名之和一致的特征(Dodge, Yadolah, 2010)。以下为Spearman Coe的通用计算公式: 符号意义: R(X), R(X): 分别为变量X, Y的排名(Ranks)或分数排名(Fractional Ranks) ρ:排名变量间的皮尔逊相关性 cov :排名变量间的协方差 σ:排名变量的标准差 当然,如果变量中没有重复值,我们可以使用以下更为简单的公式进行计算: 在计算完相关性后,需要计算相关性的显著性,去测试观察值的Spearman coe是否与0有显著的不同,所以原假设是Spearman coe等于零。t统计量近似地遵循n-2个自由度的t分布,若p value小于等于0.05,则拒绝原假设。以下为显著性的计算t值和P value的公式: 还有另一种方法与费雪变换类似,但此法主要改善皮尔逊相关系数的抽样分布,Spearman coe是基于秩而非原始数据计算的,所以无需用到此法,本文将不展开赘述。 值得注意的是,Spearman coe的计算方式并非完美。在面对失真数据时,Spearman coe将会失真,需要使用皮尔逊相关系数代替。通过数据清洗和相关性显著性检测,并未发现SMM基本面数据被截断的现象。 先行指标筛选流程 首先,从潜在先行指标库(金属进出口利润、伦敦金属交易所库存、金属成本与利润)和潜在预测指标库(金属月度平衡、金属进出口量)中俩俩抽取指标计算Spearman coe(se)与p value(pv)。不同品种有各自对应的先行、同步和滞后的se与p value的筛选条件去初步剔除统计面上不合适的先行指标。初筛后,分析师可以根据行业逻辑最终选出基本面先行指标,以此来补充相关性分析法无法解释的因果逻辑。不同品种在自变量与因变量的选取上取决于数据质量和数据频率。我们以周为测试频率,所以因变量的频率需小于或等于周度。 数据来源:SMM 十条电解铝与氧化铝基本面先行指标 通过筛选流程(以电解铝和氧化铝为例),我们得出十条稳定性和解释性较强的先行指标。从前瞻性改善(提前相关性与同步相关性差值)来看,序号1、2、18、19和20提前相关性相对于同步相关性的提升是较为明显的。主要涉及铝价、铝锭进口利润提前于电解铝进口量;沪伦比值、铝价、进口利润提前与电解铝净进口量。虽然电解铝利润对氧化铝实际消费量的前瞻性改善较小(序号16),但其先行指标的提前相关性却是电解铝与氧化铝的基本面先行指标库中最高的。十条先行指标的提前周期均落在8到15周之内。 从基本面分析师(专家经验)角度来看,序号2与20的产业逻辑正常,因为电解铝进口利润提升后会促进电解铝进口需求,所以8至10周后的进口量会增加。序号1与19产业链部分正常,虽然进口利润能促进未来进口量的增加,但进口价格并非直接影响进口量。比如,当价格变化不大时,海运费、关税等成本上升后,将导致进口利润下降,从而使进口量减少。序号15、16、17、21和22产业逻辑部分正常,根据公式“氧化铝表观消费=氧化铝产量+净进口量”,电解铝利润可能带动电解铝开工率维持高位,处于高位的电解铝产量将增加氧化铝需求。但是,对于电解铝高利润能否持续带动电解铝产量无限制提升,还需进一步验证。序号18产业逻辑部分正常,虽然沪伦比值的攀升可能会使套利机会出现促使国内对伦铝的需求增加,但套利空间还需要考虑汇率等因素。 数据来源:SMM 以下展示了4条利润类先行指标可视化和随周期变化的先行Spearman coe,提前周期基本落在10至15周之间(2至3个月以内)。铝锭进口利润先行指标提前中国电解铝月度进口量10周(图1); 电解铝利润先行指标提前氧化铝表观消费量15周(图2);电解铝利润先行指标提前电解铝月度产量14周(图3);电解铝利润先行指标提前电解铝月度年化产能13周(图4)。此外,我们还用DMA(平均线差)对先行指标进行了平滑。虽然牺牲了一部分提前相关性,但也使其较为直观地判断拐点位置。 数据来源:SMM 数据来源:SMM 专家经验加速先行指标自动筛选迭代 完全自动化筛选基本面先行指标方案能成为快速判断出基本面走向,但方案建立前期需要将专家经验量化到模型中去。专家经验将能使半自动筛选方案快速迭代为全自动迭代方案。通过对前瞻性改善的测算,我们发现被分析师剔除的先行指标前瞻性改善数值偏小。此外,根据分析师对于产业逻辑不正常先行指标的解析,我们归纳了以下三点: 先行指标逻辑链过长容易导致产业链逻辑不完全正常。比如序列6至12,中游或下游的利润、价格或进出口成本对上游的产量跨越容易导致产业链逻辑的不完全正常。 跨国界的海外库存对国内金属进口量或跨品种的价格对进口量的先行指标容易出现产业链逻辑异常。例如,序号5、14的海外铝锭库存对中国氧化铝进口量和序号3、13的电解铝现货价格对氧化铝进口量。 若大宗商品净进口和产量之长期无法完全满足国内需求,那么出口利润较难与国内库存建立正常的产业链逻辑。例如,序号23与24,国内月度库存受国内供需影响更大。进口窗口在2020年后阶段性打开来满足更多的国内需求,出口利润仍然长期处于负值状态,并没有出现大规模直接出口的情况。 数据来源:SMM 根据以上解析,我们将使用下述调整方案使流程能自动筛选先行指标 : 选取自变量与因变量时,需围绕单品目来选取,避免出现逻辑链过长的情况。 选取自变量与因变量的时,需以国家为单位,避免出现逻辑链异常的情况。 先行指标筛选时,以出口利润判断此类大宗商品的进口量和国内产量是否长期满足国内需求,从而剔除逻辑链异常的先行指标。 根据前瞻性改善,剔除一部分产业逻辑异常的先行指标。 结论         基于秩相关性与专家经验的基本面先行指标筛选法能筛选出稳定性和解释性较强的先行指标。相关性分析法量化了前瞻性程度,而专家经验分析法提供了可解释性;这两种先行指标传统筛选方法相互取长补短,结合出新的先行指标筛选流程。以电解铝和氧化铝为例,我们筛选出了十条先行指标,提前周期均在3个月以内,可以经常帮助使用者提前预判进口量、产量、消费量、年化产能等数据。         但是,新的筛选流程具有一定的局限性。首先,筛选方法并不是全自动筛选,需要借助分析师二次筛选。其次,秩相关初筛后会出现部分指标产业逻辑不完全正常的情况。根据局限性,我们对流程进行调整后,便能实现自动化筛选流程。 额外实验        我们还使用了机器学习对先行指标进行了实验。实验的目是观测机器学习堆叠预测(stacking prediction)是否会对先行指标的Spearman coe产生改善。电解铝进口利润对净进口量的提前周期为8周(图1)。我们把Ransac作为滤波器来清除一部分DMA和原值的离群值。然后,将Ransac的预测值输入到线性回归、岭回归、相邻回归、锁套回归和贝叶斯回归进行stacking拟合。模型参数需要固定随机种子,训练测试比为4:6。将各模型stacking的预测值进行等权平均(Mean)后,计算DMA(mean_DMA)。虽然从图2无法看出优劣,但从图3的可视化和图4的Spearman coe中,我们发现滤波后的Mean和Mean_DMA的相关性要优于未滤波的进口利润和DMA。然而,由于样本数量有限,前瞻性改善仍然有待提高。 图1 数据来源:SMM 图2 数据来源:SMM 图3 数据来源:SMM 图4 数据来源:SMM 文献 The Conference Board (2023)"US LEADING INDICATORS". https://www.conference-board.org/topics/us-leading-indicators. O'Sullivan, Arthur; Sheffrin, Steven M. (2003). Economics: Principles in Action. Upper Saddle River, New Jersey: Pearson Prentice Hall. p. 314 Dodge, Yadolah (2010). The Concise Encyclopedia of Statistics. Springer-Verlag New York. p. 502. ISBN 978-0-387-31742-7 注意:本文仅供参考,不构成投资建议       》点击查看SMM数据库      

微信二维码今日有色
微信二维码

微信扫一扫关注

下载app掌上有色
掌上有色

掌上有色下载

返回顶部返回顶部
publicize