局部线性嵌入算法在数据降维中的应用文献综述-文献综述网

毕业论文课题相关文献综述

1 本课题的研究背景在当今不断发展的物质世界和人类社会中，人们越来越多的接触高维数据，如全球气候，航天遥感数据，恒星光谱，消费市场数据，人的基因分布和表情的人脸图像数列等。

这些数据集的显著特点是：高维数，高数据量，非结构化。

一方面，随着维数的不断提高，数据集能够提供更多方面的更完整的信息，来帮助人们更好认识隐藏在这些表面下的事物，现象的客观规律；另一方面，维数的膨胀回引发维数灾难，即：为达到预计的估计精度，所需要的样本数随维数的增加呈指数增长，给数学和数据分析带来了重大挑战。

为了解决维数灾难问题，人们期望从高位数据中提取有效的，紧致的描述，即在保持数据信息损失最小的情况下，发掘数据集内部呈现的规律。

以人脸识别为例，受光照影响的多姿态人脸系列包含大量人脸图像，通过行堆叠的方式将其转化为64*64=4096维向量，对计算机来说，这个要求很大的存储空间和计算量，识别时相当困难的，但大脑却能再瞬间识别一个人在光照，姿态法师变化后的身份。

原因是大脑自然感知了数据的内在低维结构，这种感知以流行方式存在，将脸按照从左到右姿态，从上到下姿态，以及光照方向分为三个模式进行储藏，使得识别得到了简化。

这一典型的列子辨明：将数据的维数降低到合适大小，同时尽可能的保留原数据信息，然后将维数降维后的数据送入数据处理系统。

这种方法在很多情况下是有用的，甚至是必须的。

2 国内外研究和发展趋势现实中的高维数据大多是非线性的,这时线性方法很难发掘高维数据的结构和相关性,揭示其流形分布。

针对高维数据的非线性特性,一些基于流形学习机理的非线性降维方法被提出,打破了以主成分分析为主的传统线性降维方法的框架,很快得到国内外的广泛关注。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付