样本不对称条件下的支持向量机分类性能提升方法调研文献综述-文献综述网

毕业论文课题相关文献综述

（一）研究背景支持向量机[1]（Support Vector Machine)是Vapnik等人提出的一类新型机器学习方法。

它建立在统计学习理论基础之上，能够较好地解决小样本、高维数、非线性和局部最小点等实际问题[2]。

由于其出色的学习性能，该技术已成为继神经网络之后新的研究热点，并在很多领域得到了成功的应用，如人脸检测、文本自动分类、字符识别等。

在机器学习中，支持向量机成为了该领域上的热门方法，它是以学习理论为基础，具有泛华能力强、结构风险小、分类性能较好并且在解决凸二次规划问题上可以避免多解的崭新学习机器。

标准的支持向量机在假设类分布对称、样本数据大致相当的前提下使用时，具有较好地精度。

然而，对于不对称数据，标准的支持向量机的性能大大下降。

近几年来，关于不对称的样本分类问题的研究成为关注的热点。

面对不对称样本的挖掘，现有的研究包括两方面的内容：其一是试验研究类分布对传统算法结果的影响,验证有偏性的存在；其二是采用适当的方法重构训练样本集，来提高分类性能。

不均衡数据的分类要比均衡数据分类问题难解决。

首先在分类精度上来看，对不均衡数据进行训练时，少数类数据的分类精度要比多数类数据的分类精度差的多，这样导致少数类数据具有较低的识别率，使得在以高精度为分类目标的学习中不是最佳选择，需要对评价问题寻找更好的评价标准。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付