本篇报告将卖方策略分析的观点进行了数量化表达,并基于此构建了事件驱动类的择时策略。策略对于市场大幅上涨后的逃顶以及持续上涨行情的判断具有较好的应用效果。
◆摘要◆
策略分析观点的方向性判断
我们以研报标题作为策略分析观点的数据来源,按照以下流程将所有报告分为看多/看空/无观点研报三类:
1) 首先,分词得到标题词汇集合。我们借助Python的中文分词组件来进行分词操作,得到策略研报标题的词汇集合。
2)其次,提炼能够反映观点方向的核心词汇。我们按照词性将核心词汇分成名词、动词、形容词、副词4类。在每类词汇中,通过主观判断的方式,选择与表达市场观点具有一定相关性的词语。
3)然后,获取能够显著反映观点方向的研报标题。提炼出反映观点的核心词汇后,我们结合词汇所处的具体语境,通过关键词匹配的方法,获取能够显著反映策略分析师观点方向的研报标题集合,并将其分为看多/看空/无观点研报3类。
4)最后,借助NLP模型寻找增补研报。我们通过NLP模型来进一步搜寻无观点研报中的看多/看空研报。
寻找强趋势中的反向观点
策略分析师在周涨幅较大时发出的反向看空观点具有更高的信息含量。策略分析观点具有以下递进式特征:(1) 整体来看,策略分析师群体观点与未来市场走势之间具有一定的弱正相关性。(2) 在上一点基础上,如果策略分析师周末发布了与当周涨跌方向相反的观点,则该观点与未来市场走势之间的相关性增强。(3) 在上一点基础上,如果当周市场涨跌幅较大,且策略分析师周末发布了与当周涨跌方向相反的观点,则该观点与未来市场走势之间的相关性进一步增强。(4) 在上一点基础上,市场大涨后发布的看空观点与市场大跌后发出的看多观点相比,前者与未来市场走势之间的相关性更强。基于以上事实,我们认为周涨幅较大时发出的反向看空观点具有更高的信息含量,适合作为事件驱动类择时策略的触发信号。
基于涨后看空信号的事件驱动择时策略
以当周涨幅和周末看空观点占比为条件,构建涨后看空信号。若上周涨幅超过5%,且上周末看空数量占比大于过去52周平均值,则在本周二触发“涨后看空信号”;若上周涨幅超过5%,但上周末看空数量占比小于过去52周平均值,则在本周二触发“涨后看多信号”。
涨后看空(看多)信号与未来市场走势具有高相关性。当触发涨后看空信号时,市场未来1周、2周、1月、3月下跌的概率分别为75%、60%、75%、85%;当触发涨后看多信号时,市场未来1周、2周、1月、3月上涨的概率分别为100%、88%、100%、75%。
基于涨后看空信号的事件驱动择时策略开仓胜率可达80%以上。若触发涨后看空(看多)信号,则进行空仓(加杠杆)操作,直到满1个月或期间触发反向信号。该事件驱动择时策略开仓胜率可达81.8%,空仓期市场平均日涨跌幅为-0.27%,杠杆期市场平均日涨跌幅为0.49%,超额收益净值曲线走势稳定。
◆正文◆
策略分析的观点中汇聚了策略分析师对未来市场走势的展望与判断,具有左侧前瞻性。本篇报告将策略分析的观点进行了数量化表达,并基于此构建了事件驱动型的择时策略。策略对于市场大幅上涨后的逃顶以及持续上涨行情的判断具有较好的应用效果。
策略分析观点的方向性判断
应用策略分析观点的重要一步在于判断策略分析观点对未来市场走势的预测方向。因此,我们首先通过文本分析模型,来确定策略分析观点的方向。
在建模之前,我们需要确定策略分析观点的数据来源。策略分析师会在定期策略报告、事件点评报告、以及专题策略报告中传达传达对市场走势的最新观点。研究报告的摘要和正文是需要授权才可阅读的内容,无法作为我们建模时的数据来源;而研究报告的标题是公开可得内容,我们可以对其进行使用。因此,我们使用朝阳永续所提供的各券商策略研究报告的标题,作为策略分析观点的数据来源。
确定了数据来源后,我们希望对每一个策略分析观点做出方向性判断。不同于行业研究报告对于目标价和盈利水平的确定性预测,策略分析观点往往表达深邃,且观点方向较模糊。因此,我们借助自然语言处理的方法,按照以下步骤来判断策略分析观点的方向性:
► 首先,对研报标题进行分词,得到研报标题中的词汇集合。目的是为了进一步从中提取能够反映策略观点的核心词汇。
► 其次,统计标题词汇集合中的常见词汇,并从中提炼归纳能够反映策略分析观点的核心词汇。目的是为了进一步基于核心词汇判断研报观点。
► 然后,基于第二步寻找出的核心词汇,结合词汇具体语境,通过关键词匹配的方式,获得能够显著反映策略分析师观点方向的研报标题集合。
► 最后,以第三步得到的能够显著反映策略分析师观点方向的研报标题作为标签,训练NLP模型,并将其应用于剩余观点较模糊的研报标题之中,得到能够一定程度反映策略分析师观点方向的增补研报标题。
图表: 策略分析观点的方向性判断
资料来源:中金公司研究部
第一步,分词得到标题词汇集合
判断策略分析观点的方向性的第一步是对研报标题进行分词,从而得到研报标题中的词汇集合。我们借助Python的中文分词组件jieba包来进行分词操作,jieba包的具体分词方法可参考附录1。
通过分词,我们得到了策略研报标题的词汇集合,为进一步提取能够反映策略观点的核心词汇打下基础。
图表: 分词得到策略研报标题词汇集合
资料来源:中金公司研究部
第二步,提炼能够反映观点方向的核心词汇
对研报标的进行分词后,我们接下来从词汇集合中提炼能够反映策略分析观点的核心词汇。我们按照词性将核心词汇分成4类:名词、动词、形容词、副词。在每类词汇中,通过主观判断的方式,选择与表达市场观点具有一定相关性的词语。不同词性词汇的选择方式可以参考附录2。
图表: 分词得到策略研报标题词汇集合
资料来源:中金公司研究部
第三步,获取能够显著反映观点方向的研报标题
提炼出能够反映观点的核心词汇后,我们进一步结合词汇所处的具体语境,通过关键词匹配的方法,获取能够显著反映策略分析师观点方向的研报标题集合。
在上一部分,我们按照词性将所有核心词汇分成了名词、动词、形容词、副词4类,我们根据这4类词语的特性划分出8种语境。具体的语境定义可参考附录3。
图表:标题的八种语境
资料来源:中金公司研究部
我们分别判断每个标题是否属于各个语境。一个标题可以分属于多个语境,我们通过以下规则确定标题所反映的观点方向:
► 如果标题不属于任何语境,则认为该标题不含观点方向。
► 只要标题属于语境1或语境2,则认为该标题不含观点方向。
► 如果标题属于语境3~8中的一个或多个,且各语境规则下所反映的观点方向一致,则以该方向作为标题观点方向。
► 如果标题属于语境3~8中的两个及以上,且各语境规则下所反映的观点方向存在不一致,则一律认为该标题传达看空观点。原因在于(1)通过我们对较多该类标题的主观判断,这类标题大概率传达看空观点;(2)分析师会较为谨慎地在标题中使用悲观词语,因此该类词语一旦出现,大概率标题会传达看空观点。
根据以上规则,我们将所有研报标题分为三类:看多研报、看空研报、无观点研报。
图表:根据规则区分三种研报标题
资料来源:中金公司研究部
第四步,借助NLP模型寻找增补研报
通过NLP模型来进一步搜寻无观点研报中的看多/看空研报。上一小节中,我们结合具体语境,使用关键词匹配方式获得了看多/看空/无观点研报。这种方式划分研报的优点在于选择出的看多/看空研报具有较高的准确率,但劣势在于查全率较低,即还有相当一部分实际看多/看空研报被归在了无观点研报之中。因此,我们希望通过NLP模型来进一步搜寻无观点研报中的看多/看空研报。NLP模型的细节可参考附录4。
通过NLP模型增补约20%看多/看空研报。在已有看多/看空研报的基础上,NLP模型可以从原无观点研报中增补约20%的看多/看空研报。主观判断来看,增补的研报具有较高的准确性。
图表: 通过NLP模型寻找增补研报
资料来源:中金公司研究部
通过以上流程,我们根据研报标题信息,将所有策略研究报告分为了看多/看空/无观点研报三类。在下一步章节中,我们将根据策略研究报告的观点方向,构建事件驱动型的择时策略。
寻找强趋势中的反向观点
在第一章节中,我们根据研报标题信息,将所有策略研究报告分为了看多/看空/无观点研报三类。我们最终发现,策略分析师在周涨幅较大时发出的反向看空观点具有更高的信息含量。我们依次通过以下递进式结论来证明这一点:
► 整体来看,策略分析师群体观点与未来市场走势之间的具有一定的弱正相关性。
► 在上一点基础上,如果策略分析师周末发布了与当周涨跌方向相反的观点,则该观点与未来市场走势之间的相关性增强。
► 在上一点基础上,如果当周市场涨跌幅较大,且策略分析师周末发布了与当周涨跌方向相反的观点,则该观点与未来市场走势之间的相关性进一步增强。
► 在上一点基础上,市场大涨后发布的看空观点与市场大跌后发出的看多观点相比,前者与未来市场走势之间的相关性更强。
图表: 周涨幅较大时发出的反向看空观点具有更高的信息含量
资料来源:中金公司研究部
策略分析师会在每周的周报中发布对于下周市场走势的判断,而在实际操作中,部分策略周报在下周一才会公开对外发布。因此,为保证对每周观点进行统计时的全面性,我们以周二凌晨作为划分点,统计从上周二到本周一的各类策略报告,作为上周策略分析师对本周市场走势的观点集合。对每周多空研报数量的基础描述性统计可参阅附录5。
第一,整体来看,策略分析师群体观点与未来市场走势之间的具有一定的弱正相关性。我们计算了每周的多空研报占比及变化与未来一段时间市场涨跌方向之间的相关性,如无特殊说明,本文市场指数均使用中证全指。根据结果,多空观点占比及变化与市场未来1周、2周、1月、3月的涨跌方向之间的相关性方向不一,但整体偏弱正相关。也就是说,整体来看,策略分析师群体观点与未来市场走势之间具有一定的弱正相关性。
图表: 策略分析师群体观点与未来市场走势之间的具有一定的弱正相关性
资料来源:朝阳永续,万得资讯,中金公司研究部
第二,如果策略分析师周末发布了与当周涨跌方向相反的观点,则该观点与未来市场走势之间的相关性增强。前面我们在分析策略分析师观点与未来市场走势之间的相关性时,并没有考虑本周市场涨跌的情景。根据附录5中的描述性统计,策略分析师周末的观点方向与当周涨跌幅高度正相关,因此我们认为相对而言,与当周涨跌方向相同的周末观点包含了更少的信息量,而与当周涨跌方向相反的周末观点包含了更多的信息量。为证明这一点,我们计算了当周末多空研报占比之差与当周涨跌方向相反时,多空研报占比之差与未来一段时间涨跌方向之间的相关性。从结果看,此时两者之间正相关性有所增强,最高可以达到10%左右的水平,已初步具有一定的正相关性,说明与当周涨跌方向相反的周末观点确实包含了更多的信息量。
图表: 与当周涨跌方向相反时,周末观点方向与下周涨跌相关性增强
资料来源:朝阳永续,万得资讯,中金公司研究部
第三,周涨跌幅较大时发出的反向观点长期有效性更强。相对于平稳行情中 “轻指数、重结构”的配置思路,在周涨跌幅较大的趋势性行情中,投资者更需要获取对市场未来走势的左侧判断,策略分析师也会更为仔细与慎重地发表对市场未来走势的观点,因此,策略分析师在周涨跌幅较大时发出的反向观点可能有效性更强。为验证这一点,我们计算了周末观点方向与当周涨跌方向相反,且周涨跌幅绝对值大于不同阈值的情况下,周末观点方向与未来一个月涨跌方向的相关性。从结果看,随着周涨跌幅阈值的扩大,周末观点方向与未来一个月涨跌方向的相关性呈上升趋势,这说明在周涨跌幅较大的趋势市中,策略分析师发出的反向观点具有更强的长期有效性。
需要注意的是,造成以上现象的一个潜在可能性在于市场的长期反转,即某周涨跌幅绝对值扩大时,未来市场可能会有更高的概率表现出反向走势。为了去除这一方面的可能影响,我们同时计算了周涨跌幅绝对值大于不同阈值的情况下,本周涨跌方向与未来一个月涨跌方向的相关性。从结果看,不同阈值下两者均为正相关性,即整体来看,市场并不存在一个月维度的长期反转,反而会有一个月维度的长期动量。
图表: 周涨跌幅较大时发出的反向观点长期有效性更强
资料来源:朝阳永续,万得资讯,中金公司研究部
第四,市场大涨后发布的看空观点与市场大跌后发出的看多观点相比,前者与未来市场走势之间的相关性更强。根据附录5的描述性统计,整体来看,看多研报的数量要高于看空研报,这可能与A股做多比做空成本更低等多种因素有关。不论造成该现象的原因如何,从这一现象出发,我们认为策略分析师在给出看空研报时可能会考虑得会更加谨慎与周全,因此大涨后的反向看空观点有效性可能会高于大跌后的反向看多观点。为验证这一点,我们在上一步测算的基础上,分别计算了当周上涨后周末看跌以及当周下跌后周末看涨两种不同状态下,周末观点方向与未来1个月涨跌方向的相关性。从结果看,当周上涨且周末观点偏空时,周末观点方向与未来1个月涨跌方向的相关性要显著高于当周下跌且周末观点偏多时的相关性,且周跌幅较大时,反向看空信号与未来1个月涨跌方向之间的相关系数接近50%。也就是说,周涨跌幅较大时的反向看空观点比反向看多观点有效性更强。
图表: 周涨跌幅较大时发出的反向观点长期有效性更强
资料来源:朝阳永续,万得资讯,中金公司研究部
综上所述,我们认为周涨幅较大时发出的反向看空观点具有更高的信息含量,适合作为事件驱动类择时策略的触发信号。在下章节,我们将介绍具体的策略构建方式。
基于涨后看空信号的事件驱动择时策略
涨后看空信号的构建方式
上一章节中,我们证明了周涨幅较大时发出的反向看空观点具有相对更高的信息含量,因此,我们希望借其来构建事件驱动型择时策略。我们通过以下步骤来构建“涨后看空信号”:
►统计每天的策略报告数量和看空报告数量。根据第一章节的介绍,看空报告分为两类,第一类是通过关键词匹配的方式得到的能够显著反映看空观点的报告,第二类是通过NLP模型从无观点研报中进一步搜寻出的增补看空报告。我们认为通过关键词匹配的方式得到的看空报告准确性相对更强,通过NLP模型得到的看空报告准确性相对较弱,因此在统计每天看空报告数量时,通过关键词匹配方式得到的看空报告记为1篇,通过NLP模型得到的看空报告记为0.5篇。
►每周二凌晨,统计上周二至本周一的策略报告数量和看空报告数量。部分策略周报会在周一才会公开对外发布,为每周观点的统计全面性,我们以周二凌晨作为划分点,统计从上周二到本周一的策略报告总量,以及其中的看空报告总量。
►计算上周看空报告数量占比。得到上周策略报告总量和其中的看空报告总量后,将两者相除,得到上周看空报告的数量占比。
►若上周涨幅超过5%,且上周末看空数量占比大于过去52周平均值,则在本周二触发“涨后看空信号”。信号的触发一方面需要上周具有较大涨幅,另一方面需要上周末策略分析师发出了相比过去1年平均水平占比更高的看空报告,即大涨市中的超悲观。
图表: 涨后看空信号构建流程
资料来源:中金公司研究部
涨后看空信号的预测效果
涨后看空信号对未来市场走势具有较为出色判断效果。我们分别测试了涨后看空信号触发后,未来1周、2周、1月、3月的市场涨跌情况(从本周三涨跌幅开始计算)。同时,为验证涨后看空信号召回率,我们同时也测算了达到5%涨幅条件,但看空数量占比小于过去52周平均值(我们称该信号为“涨后看多信号”)时,未来一段时间的市场涨跌情况。从结果看,当触发涨后看空信号时,市场未来1周、2周、1月、3月下跌的概率分别为75%、60%、75%、85%;同时,当触发涨后看多信号时,市场未来1周、2周、1月、3月上涨的概率分别为100%、88%、100%、75%。也就是说,若本周涨幅较高,且周末策略分析师发布了相比历史更多的看空观点,则市场未来一段时间大概率会出现下跌,其中未来3个月下跌的概率高达85%;若本周涨幅较高,但周末策略分析师并未发布相比历史更多的看空观点,则市场未来一段时间大概率会持续上涨,其中未来1周和1个月上涨的概率高达100%。
图表:涨后看空信号对未来市场走势具有较为出色判断效果
资料来源:朝阳永续,万得资讯,中金公司研究部
上涨判定阈值越高,触发次数越少,胜率整体越高。信号的构建过程涉及两个参数:本周上涨幅度x和上周看空数量占比大于过去y周平均值。y=52是较为平凡的参数,对应过去1年的平均值,经过实际测试,y在52~104之间变动时,对结果的影响微乎其微 。上涨幅度x是一个较为敏感的参数,对整体胜率和触发次数有一定影响。我们分别测试了x取值从3%~7%时的效果,从结果看,随着x取值的增大,信号触发次数逐渐降低,在增大至6%之前,胜率整体呈上升趋势,而在增大至6%之后,看空信号的长期(1月、3月)胜率继续升高,而短期(1周、2周)胜率有所下降;看多信号的胜率整体有所下降。综合触发次数和多空胜率,我们建议将x选择在4%~6%之间,本篇报告中,我们选择取值适中的5%作为上涨判定阈值。从数量统计看,2010年1月至今共计600周内,中证全指超过5%的周涨幅共出现过28次,占比接近1/20,具有一定的特异性,但并非过于极端。
图表:不同上涨判定阈值对触发次数和胜率的影响
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:中证全指不同周涨跌幅数量分布
资料来源:万得资讯,中金公司研究部。统计区间:2010/1/1~2021/7/2
不同于涨后看空信号,跌后看多信号的预测效果较差。类似于涨后看空信号的构建方式,我们可以定义“跌后看多信号”为:上周跌幅超过x%,且上周末看多研报数量占比大于过去52周平均值。我们测试了不同下跌判定阈值x下,信号未来一段时间的胜率。从结果看,在各下跌判定阈值x下,基于跌后看多信号所作出的未来方向判断胜率均不高,预测效果较差。
图表:跌后看多信号的预测效果较差
资料来源:朝阳永续,万得资讯,中金公司研究部。
基于涨后看空信号的事件驱动择时策略
我们最后将涨后看空信号进行实际应用,构建具体的事件驱动择时策略,方法如下:
► 初始情形为100%持仓中证全指。
► 每周二凌晨,判断是否触发涨后看空信号(以及满足上涨条件,但不满足看空条件的“涨后看多信号”),上涨判定为上周涨幅超过5%。
► 如果触发涨后看空信号,则以当日(若当日休市则顺延至未来第一个交易日,下同)收盘价卖出中证全指,维持空仓状态,直到空仓满n天或触发涨后看多信号后,以当日收盘价买入中证全指,恢复100%持仓状态。
► 如果触发涨后看多信号,则以当日收盘价买入中证全指至1倍杠杆,维持200%持仓状态,直到持仓满n天或触发涨后看空信号后,以当日收盘价卖出中证全指,恢复100%持仓状态。
► 回测区间为2010年1月5日至2021年7月2日。
► 暂不考虑交易手续费。
出现信号后,进行为期1个月(21个交易日)的实际应用效果最好。我们分别测试了n=5,10,21,63时(对应持有1周,2周,1月,3月),上述策略的绝对收益曲线,以及相对于100%持仓基准的超额收益曲线。从结果看,不同的开仓持有期下,策略均有较高的开仓胜率以及较为稳定的超额收益;对比之下,当n=21,即出现信号后进行为期1个月的操作时,策略的累计超额净值最高,超额净值走势较为稳定,开仓胜率可达81.8%,空仓期市场平均日涨跌幅为-0.27%,杠杆期市场平均日涨跌幅为0.49%。因此,我们建议在实际应用中,出现相应信号后进行为期1月的操作。
图表:信号触发后操作1周回测结果
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:信号触发后操作2周回测结果
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:信号触发后操作1月回测结果
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:信号触发后操作3月回测结果
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:多空信号触发时点统计
资料来源:朝阳永续,万得资讯,中金公司研究部
最近一次的涨后看空信号触发于2021年2月16日,即春节期间,有效捕捉到了春节之后股市的快速下杀;最近一次的涨后看多信号触发于2020年7月7日,即去年7月份A股快牛的后半程,一定程度把握到了大涨后的延续行情。
图表:多空信号触发时点统计
资料来源:朝阳永续,万得资讯,中金公司研究部
图表:多空信号触发时点与市场走势
资料来源:朝阳永续,万得资讯,中金公司研究部
附录
附录1:jieba包的分词方式
Jieba在分词时,共有3种模式可以选择,分别是精确模式、搜索引擎模式和全模式。
► 精确模式的特点可以概括为“切割”,将句子中的各词语从左至右依次切分提取。举例来说,“中国国际金融股份有限公司”在精确模式下的分词结果为['中国', '国际金融', '股份', '有限公司']。
► 搜索引擎模式的特点可以概括为“双重切割”,在精确模式切割后的基础上,对长词再次进行切割。举例来说,“中国国际金融股份有限公司”在搜索引擎模式下的分词结果为['中国', '国际', '金融', '国际金融', '股份', '有限', '公司', '有限公司']。
► 全模式的特点可以概括为“地毯式搜索”,会尽可能穷举出能够成词的组合。举例来说,“中国国际金融股份有限公司”在全模式下的分词结果为['中国', '国际', '国际金融', '金融', '金融股', '股份', '股份有限', '有限', '有限公司', '公司']。
可以看出,精确模式强调非冗余下的精确切分,切分效率最高,但往往会遗漏部分短词语,如前例“国际金融”中的“国际”和“金融”被遗漏掉;全模式强调切分结果的全面性,尽可能不遗漏任何能够成词的组合,但往往会包含一些明显与句意无关的词组,如前例中的“金融股”;搜索引擎模式的特点居于前面两种模式之间,在尽量不含无关词组的情况下,对精确模式下的长词再次切割,提高短词组的召回率。
我们使用搜索引擎模式作为策略研报标题的分词方法。国内策略研究报告标题具有两方面特点:一是信息量大,往往简短的语句便包含了充足的信息;二是表达深邃,随意的解读往往会引起歧义。因此如果使用精确模式进行分词,可能会遗漏一些包含重要信息的短词语;如果使用全模式进行分词,可能会产生较多歧义词组。综上考虑,我们使用搜索引擎模式作为策略略研报标题的分词方法,从而得到了策略研报标题的词汇集合。
附录2:不同词性词汇的选择方式
对研报标的进行分词后,我们接下来从词汇集合中提炼能够反映策略分析观点的核心词汇。我们按照词性将核心词汇分成4类:名词、动词、形容词、副词。在每类词汇中,通过主观判断的方式,选择与表达市场观点具有一定相关性的词语。不同词性词汇的选择方式如下:
► 名词选择体现市场主体、反映市场环境、或描述市场影响因素的词汇。举例来说,“创业版”、“黄金”体现报告进行分析的市场主体,“牛市”、“熊市”反映当前市场所处的环境,“情绪”、“估值”描述市场的影响因素。
► 动词选择体现市场运行方向、或描述市场及影响因素变化的词汇。举例来说,“回调”、“反攻”体现市场运行方向、“降低”、“淡化”描述情绪等市场影响因素的变化。
► 形容词用来修饰名词,选择能够体现判断主体或市场影响因素状态的词汇。举例来说,“大盘”+“疲弱”、“高+“估值””体现大盘与估值当前所处的状态。
► 副词用来修饰动词,选择能够体现市场运行方向与市场影响因素变化状态的词汇。举例来说,“回调”+“结束”、“加速”+“反弹”体现回调和反弹的状态。
在选择词汇时,由于词汇集合中词语数量庞大,我们仅关注在研报标题中出现频次高于0.5%的词语。
附录3:研报标题的8种语境
基于已经寻找出的名词、动词、形容词、副词4类核心词汇,我们根据这4类词语的特性划分出8种语境:
► 语境1:对无关市场的判断(名词判断)。如果研报标题包含非A股的判断主体名词,如“黄金”、“欧美”、“大宗”等,且不包含A股的判断主题名词,如“A股”、“国内”等,则认为报告的判断主体不是A股,一律将这些标题舍弃,不参与后续判断。
► 语境2:疑问句式。如果研报标题以“?”、“吗”、“什么”等疑问句式结尾,则认为报告标题中不含对市场未来方向的确定性判断,一律将这些标题舍弃,不参与后续判断。
► 语境3:走势延续1(名词+动词判断)。如果研报标题包含反映市场环境的名词,如“底部”、“熊市”,且未跟表示反转的动词,如“反弹”、“收尾”,则以名词所反映的市场环境作为研报判断方向。
► 语境4:走势延续2(动词+副词判断)。如果研报标题包含反映市场运行方向的动词,如“上涨”、“回调”,且不跟表示反转的副词,如“乏力”、“结束”,则以动词所反映的市场运行方向作为研报判断方向。
► 语境5:走势反转1(名词+动词判断)。如果研报标题包含反映市场环境的名词,如“底部”、“熊市”,且紧跟表示反转的动词,如“反弹”、“收尾”,则以名词所反映市场环境的反方向作为研报判断方向。
► 语境6:走势反转2(动词+副词判断)。如果研报标题包含反映市场运行方向的动词,如“上涨”、“回调”,且紧跟表示反转的副词,如“乏力”、“结束”,则以动词所反映市场环境的反方向作为研报判断方向。
► 语境7:影响因素的状态(名词+形容词判断)。如果研报标题包含反映市场影响因素的名词,如“情绪”、“风险”,且紧跟表示状态的形容词,如“高涨”、“较小”,则以影响因素的方向结合状态方向作为研报判断方向。
► 语境8:影响因素的变化(名词+动词判断)。如果研报标题包含反映市场影响因素的名词,如“情绪”、“风险”,且紧跟表示变动方向的动词,如“降”、“增”,则以影响因素的方向结合变动方向作为研报判断方向。
附录4:寻找增补研报的NLP模型
通过关键词匹配的方式获得了看多/看空/无观点研报后,我们通过NLP模型来进一步搜寻无观点研报中的看多/看空研报。模型的构建具体分为以下4步:
► 第一步:打标签。我们以关键词匹配方法获得的看多/看空研报作为看多与看空标签。特别地,我们还希望获得无观点的中性标签,一种直接的思路是将关键词匹配方法获得的无观点研报作为中性标签,但如前所述,无观点研报中包含了部分实际的看多/看空研报,直接将无观点研报作为中性标签会使标签不纯,降低模型预测有效性。出于此考虑,我们借助了姜富伟等在《媒体文本情绪与股票回报预测》(经济学(季刊),已接受待发表)中所提供的乐观与悲观词组,如果无观点研报标题中含有这些词组之一,则认为该研报有相对较高概率属于实际的看多/看空研报,不为这些研报打标签;如果无观点研报标题中不含这些词组,则认为该研报有相对较低概率属于实际的看多/看空研报,为这些研报打中性标签。
► 第二步:分离训练集与测试集。我们将第一步后拥有标签的标题集合作为标签样本集合,将标签样本集合按照3:1的比例随机分离为训练集和测试集。
► 第三步:训练模型。我们调用sklearn函数包中朴素贝叶斯模型MultinomialNB对训练集进行三分类拟合。朴素贝叶斯模型的优势在于对文本类型的高维数据适用性强,能处理此类多分类任务,模型的数学原理清晰,对于模型训练与预测结果的可解释性较强。但缺陷在于当样本属性个数比较多或者属性之间相关性较大时,分类效果欠佳。考虑到我们的标题文本通常较短,属性之间相关性偏小,所以该缺陷对结果的影响相对较小。
► 第四步:模型预测。将上一步训练好的模型应用于无观点研报集合,得到通过NLP模型所寻找出的增补看多/看空研报。
模型有效性较强,在测试集中的准确率与召回率均达85%以上。
附录5:各类观点报告的描述性统计
纳入统计的券商数量较为充分且稳定。充分与稳定的数据来源是研究结论有效的重要保证,我们统计了朝阳永续数据库中,每年发布策略报告数量大于52篇(每周至少1篇)的券商数量。从结果看,2010年至今,基本每年都可以保证有40余家定期发布策略报告券商纳入数据库,尤其是2017年以后,每年都可以有近60家定期发布策略报告的券商被纳入统计。以上结果有助于保证我们在分析策略分析师观点时,能够较为全面的反映市场上主流策略分析师的声音。
图表:纳入统计的券商数量较为充分且稳定
资料来源:朝阳永续,中金公司研究部
多空观点占比负相关性强,近些年分化明显。我们计算了每周看多/看空报告的数量占比,两者时序相关性为-43.08%,具有较强的负相关性,说明策略分析师具有一定程度的观点一致性:当该周看多观点增加时,看空观点大概率会减少。从两类研报的占比变化看,在2015年之前,多空研报的占比差距不大,而在2015年之后,看多研报的占比长期高于看空研报,尤其是2019年以后,多空观点研报占比迅速拉开,看多研报数量震荡提升,看空研报数量趋势下降,这也与2019年以来整体的牛市环境相辅相成。
图表:多空观点占比负相关性强,近些年分化明显
资料来源:朝阳永续,中金公司研究部
策略分析师周末的观点方向与当周涨跌幅高度正相关。我们计算了每周末的多空观点占比之差,与当周涨跌幅之间的相关性。从结果看,两者之间的相关性为45.60%,具有较高的正相关性。类似地,我们计算了当周不同的涨跌幅范围内,周末多空观点占比之差的平均值,根据结果,当周涨跌幅小于-5%时,周末多空观点占比之差平均为-1.96%;当周涨跌幅在-5%~0%内时,周末多空观点占比之差平均为-1.20%;当周涨跌幅在0%~5%内时,周末多空观点占比之差平均为5.45%;当周涨跌幅大于5%时,周末多空观点占比之差平均为8.34%.以上结果说明策略分析师相对倾向于追随市场的方向,做出市场趋势进一步延续的判断。
图表:策略分析师周末的观点方向与当周涨跌幅高度正相关
资料来源:朝阳永续,万得资讯,中金公司研究部
文章来源
本文摘自:2021年7月14日已发布的《量化配置系列(5):如何从策略分析观点中捕捉左侧机会》
联系人 宋唯实 SAC 执业证书编号:S0080120090082 SFC CE Ref:BQG075
分析员 周萧潇 SAC 执业证书编号:S0080521010006 SFC CE Ref:BRA090
分析员 刘均伟 SAC 执业证书编号:S0080520120002 SFC CE Ref:BQR365
分析员 王汉锋 SAC 执业证书编号:S0080513080002 SFC CE Ref:AND454
牛市来了?如何快速上车,金牌投顾服务免费送>>