基于单特征因子的隐马尔科夫模型在商品期货上的应用文献综述

 2023-08-18 07:08
  1. 选题背景和意义:

隐马尔科夫模型作为一种机器学习方法曾广泛应用于语音识别领域,目前又 被大量地研究应用于金融市场当中。 隐马尔科夫模型对金融市场的择时预测主要涉及到两个问题,第一个是从已知观测值序列(特征因子)到最适合的模型参数的学习估计问题,第二个是 从待预测的观测值序列到最可能的隐状态序列的解码预测问题。

隐马尔科夫模型(HMM) 最早是在 20 世纪 60 年代由 L. E. Baum 提出的,Baum 在后来加入了一家基金公司 Monemetrics,而这家公司则是日后大名鼎鼎的文艺复兴科技公司的前身。但是把隐马尔科夫模型 “发扬光大”的应用则是进行语音识别,李开复曾在其博士毕业论文中提出来基于 HMM构建的一 个用于语音识别的系统 Sphinx,并被《商业周刊》评为 1988 年美国最重要的科技发明。尽管如 今语音识别领域可能更多地采用了深度学习的方法,但 HMM也算是对这一领域的研究做出巨大贡献。

刚才提到的文艺复兴科技公司可谓是基金投资领域的传奇,通过进行量化投资连续 27 年的投资回 报率高于股神巴菲特。市场上不少人猜测其创始人西蒙斯和他所招募的“小伙伴们”——数学教授或语音识别专家,最早在外汇交易上使用了隐马尔科夫模型。受此启发,也越来越多的人尝试在金 融市场当中使用 HMM来对市场进行预测。

如果把隐马尔科夫模型应用到金融市场的话,那么我们需要考虑的其实主要是两种问题:第一是对 HMM的参数估计(学习),第二是基于观测值的状态预测(解码)。已某交易所内交易的商品期 货为考察对象的话,假设该商品的内在状态为牛市涨、跌和震荡已经熊市中涨、跌和震荡,所以不同的隐状态反映的不仅仅是表面的涨跌情况不一,而且也可能反映了市场环境的不同。如果只是仅仅知道它的交易价格,实际上仍然无法知道它所处的隐状态。实际上,交易价格、成交量等截面特征因子信息序列都是该商品在被交易时被观察到的表观“现象”,我们可以通过这些特征因子序列 来刻画商品的交易状态,就如同物理学中对粒子状态的描述需要知道参考系中的粒子的坐标 x和动量 p 一样。因此有了多维的观测值序列,而商品期货的隐状态序列便可以通过 HMM这个“黑匣子” 得到。首先,我们将一段 k 维的观测值时间序列通过 EM算法,采用极大似然的方法进行参数估计, 估计出 HMM最可能的参数组合。然后根据未来的观测值序列,利用已训练好的 HMM对未来的状态进行预测。

  1. 课题关键问题及难点:

关键问题:

  1. 了解关于商品期货市场的很多基本概念,包括商品期货合约的基本面概念和交易规则
  2. 通过以往机器学习以及随机过程的知识,学习隐马尔科夫模型的基本概念,模型以及应用场景
  3. 了解隐马尔科夫模型在金融市场中的应用情况
  4. 通过python编程对商品期货数据进行清洗和处理,利用Python构建商品期货交易测试框架。

难点:

1. 理论基础方面,对半监督学习理论的学习需要一定的机器学习理论作为基础并涉及了大量的数学推导,这要求我必须提前花时间学习相关的理论,并且在阅读文献过程中有可能在某些章节出现难以预计的难点拖慢进度。

2. 编程能力方面,使用python进行相关编程对编程能力提出了较高要求。总的来说,要解决这些问题首先要着眼于商行品期货市场的大框架。

3. 针对商品期货交易的特征,从两大方面思考问题:第一个是从已知观测值序列(特征因子)到最适合的模型参数的学习估计问题,第二个是从待预测的观测值序列到最可能的隐状态序列的解码预测问题。基于样本内数据,需要着重思考影响马尔可夫模型在应用时的预测准确率大小的因素。

  1. 文献综述(或调研报告):

Hassan在[1]中将机器学习方法中常见的隐马尔科夫模型HMM用于预测股票市场。在给出历史数据的情况下,本文提出了最大后验HMM方法来预测第二天的股票价值。 在本文的方法中,考虑了股票价值的小幅变化以及股票的日内高点和低点来训练连续HMM。 然后,使用此HMM对第二天所有可能的库存值做出最大后验决策。 作者在几种股票上测试了该方法,并将其与使用HMM和使用平均绝对百分比误差(MAPE)的人工神经网络的一些现有方法的性能进行了比较。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。