Wrapper式高维数据特征选择方法研究文献综述

 2021-11-08 10:11

毕业论文课题相关文献综述

文 献 综 述研究背景:特征选择在数据分析和预处理步骤中发挥着重要的作用,通过特征选择可以删除无关、冗余的信息,降低训练样本的维数、降低算法的复杂度和噪音的干扰,提高模型的推广能力,因而在分类问题中起着很重要的作用。

一个特征选择的过程在原理上可以看成是一个组合优化过程:在原有的特征中选择其中的一部分,使某个给定的评价函数最优。

特征选择框架指出一个特征选择算法是由特征子集生成、特征子集评价、停止条件和结果验证四个部分组成的。

特征选择在模式识别领域中现在扮演着一个非常重要的角色 。

其一方面 ,在样本有限的情况下 ,用很大数量特征来设计分类器无论是从计算开销还是从分类器性能来看都不合时宜 ;其另一方面 ,特征和分类器性能之间并不存在着线性关系 ,当特征数量超过一定的限度时 ,会导致分类器的性能变坏 。

因此 ,进行正确有效的特征选择成为模式识别中一定要解决的问题 ,在大量数据条件下尤为重要 。

尽管已经有很多进行特征获取的方法 ,但针对解决实际问题的研究还很不充分 。

如何组合利用现有的方法 ,以及针对特定问题提出新的方法 ,是目前特征获取方法研究的发展方向 。

国内外现状:经典特征选择定义为从 N 个特征集合中选出 M 个特征的子集 ,并满足条件。

它包括特征提取和特征选择两个方面 :特征提取广义上指的是一种变换 , 将处于高维空间的样本通过映射或变换的方式转换到低维空间 , 达到降维的目的 ;特征选择指从一组特征中去除冗余或不相关的特征来降维 。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

免费ai写开题、写任务书: 免费Ai开题 | 免费Ai任务书 | 降AI率 | 降重复率 | 论文一键排版