毕业论文课题相关文献综述
1 本课题的研究背景在当今不断发展的物质世界和人类社会中,人们越来越多的接触高维数据,如全球气候,航天遥感数据,恒星光谱,消费市场数据,人的基因分布和表情的人脸图像数列等。
这些数据集的显著特点是:高维数,高数据量,非结构化。
一方面,随着维数的不断提高,数据集能够提供更多方面的更完整的信息,来帮助人们更好认识隐藏在这些表面下的事物,现象的客观规律;另一方面,维数的膨胀回引发维数灾难,即:为达到预计的估计精度,所需要的样本数随维数的增加呈指数增长,给数学和数据分析带来了重大挑战。
为了解决维数灾难问题,人们期望从高位数据中提取有效的,紧致的描述,即在保持数据信息损失最小的情况下,发掘数据集内部呈现的规律。
以人脸识别为例,受光照影响的多姿态人脸系列包含大量人脸图像,通过行堆叠的方式将其转化为64*64=4096维向量,对计算机来说,这个要求很大的存储空间和计算量,识别时相当困难的,但大脑却能再瞬间识别一个人在光照,姿态法师变化后的身份。
原因是大脑自然感知了数据的内在低维结构,这种感知以流行方式存在,将脸按照从左到右姿态,从上到下姿态,以及光照方向分为三个模式进行储藏,使得识别得到了简化。
这一典型的列子辨明:将数据的维数降低到合适大小,同时尽可能的保留原数据信息,然后将维数降维后的数据送入数据处理系统。
这种方法在很多情况下是有用的,甚至是必须的。
2 国内外研究和发展趋势现实中的高维数据大多是非线性的,这时线性方法很难发掘高维数据的结构和相关性,揭示其流形分布。
针对高维数据的非线性特性,一些基于流形学习机理的非线性降维方法被提出,打破了以主成分分析为主的传统线性降维方法的框架,很快得到国内外的广泛关注。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
