基于统计学习方法的金融数据分析与预测文献综述

 2022-09-25 02:09

  1. 文献综述(或调研报告):

金融市场可以看做是一个复杂的、进化的、非线性的动力系统。财务领域预测的特点是数据强度高,有噪声,非固定,非结构化性质,以及高不确定度和含有隐藏关系。 许多因素在金融方面互为影响事件,比如总体经济状况和交易者的期望。因此,预测金融市场的数据非常困难,比如价格走势等。根据学术调查,运动越来越多在市场价格不随机。而且,它们表现为高度非线性、动态的方式。

支持向量机(SVM)是一种非常特殊的统计学习算法,其特征在于决策函数的容量控制,核函数的使用和稀疏性。建立在结构风险最小化原则的独特理论上,通过最小化泛化误差的上限来估计函数,SVM被显示为非常抵抗过度拟合问题,最终实现高泛化性能。SVM的另一个关键属性是训练SVM等同于求解线性约束二次规划问题,这就使得SVM的解决方案始终是唯一的,并且是可以达到全局最优的。

已有的SVM在财务预测问题中的一些应用,在大多数情况下,某些预测的准确度和可接受性是通过估计与观察值的偏差的方法来衡量的。对于金融市场的从业者,基于最小化预测误差的方法可能不足以实现其目标。换句话说,由具有小预测误差的特定预测驱动的交易可能不如通过准确预测运动方向来指导交易盈利的多。

支持向量机(SVM)是非常流行的线性判别方法,它建立在一个简单但强大的思想基础之上。 样本从原始输入空间映射到高维特征空间,其中可以找到“最佳”分离超平面。如果其边界最大,则分离超平面H最好。边界被定义为两侧平行于H的两个超平面之间的最大距离,它们之间不包含采样点且它遵循风险最小化原则。分离超平面是距离它最大距离的不同类别的最近点的集合,因为两组样本彼此分开最大边距,所以对超平面方向上的微小误差最不敏感。如果问题不是线性可分的,则是通过使用非线性基函数将问题映射到新空间。

股票市场预测被认为是金融时间序列的一项具有挑战性的预测任务。 已有许多研究在这片领域使用人工神经网络(ANNs)。大量成功的应用表明ANN是可行的。时间序列建模和预测的一个非常有用的工具。早期的这些研究侧重于人工神经网络在股票市场预测中的应用。最近的研究倾向于杂交几种人工智能(AI) 技术。一些研究人员倾向于包括新的因素如学习过程等,需要结合先前的知识来改进股票市场预测的表现。

然而,其中一些研究表明,ANN在学习方面存在一些模式的局限性,拿股票市场的数据来举例,股票市场数据有巨大的噪音和复杂的维度。ANN通常在噪声数据上表现出不一致和不可预测的特性。然而,最流行的神经网络模型即反向传播(BP)神经网络,在选择大量控制参数方面存在困难,包括相关输入变量,隐藏层大小,学习率,动量项等。 许多传统的神经网络模型已经实施了经验风险最小化原则,SVM实现了结构风险最小化原则。 前者旨在尽量减少错误分类、错误或偏离正确的训练数据解决方案,但后者是能够搜索到最小化泛化误差的上限的。另外,因为SVM的解决方案可以是全局最优的,而其他神经网络模型可能倾向于陷入局部最佳解决方案,所以说,SVM不太可能发生过度拟合。

参考文献:

  1. Joseph D, Biju V G. A Predictive Stock Data Analysis with SVM-PCA Model[J]. International Journal of Computer Science amp; Business Informatics, 2014, 9(1).

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。