统计语言模型SLM 

语音识别专家要识别一段语言,即选择一组可能性最大的句子,首先将句子分词,然后根据语料库估算一个给定语句的可能性,从而选择可能性最大的语句作为识别结果。同样在股市择时中,我们将历史行情数据进行符号化之后,转化为涨跌符号序列,在给定过去一段时间内的涨跌序列后,我们计算该条件下的未来涨跌的条件概率。较大者为预测结果,相比较而言,我们的语料库为历史价格数据

本帖不对SLM(Statistical Language Model)做过多介绍,详细内容可以参照Wikipedia


N 元模型及其择时应用 
设指数收盘价序列为,我们首先将该价格序列转化为符号序列,即进行符号化,符号序列为,其中如果,则,否则
对于择时问题,我们仅需要判断下一个交易日的涨跌即可,那么如何进行判断呢,我们需要获取下一个交易日的涨跌的概率,上涨的概率大则判断上涨,下跌的概率大则判断为下跌。那么如何计算涨跌概率呢? 

类似于统计语言模型,其中一段词句(符号串)出现的概率我们根据语料库(历史行情序列)来进行训练得到,具体为 


根据上述 N 元模型,即可判断下一个交易日的涨跌,如果,判断为上涨,否则判断为下跌。

本策略即按照上述逻辑进行交易操作,如果下一个交易日判断方向与当前持仓方向相同,那么不进行操作;如果持仓方向不一致,那么进行先平仓再开仓的操作。 

 注:本策略选取的数据为日线数据,标的为IH股指期货