基于PCA及其改进算法的研究Word下载.doc
- 文档编号:851471
- 上传时间:2023-04-29
- 格式:DOC
- 页数:60
- 大小:1.62MB
基于PCA及其改进算法的研究Word下载.doc
《基于PCA及其改进算法的研究Word下载.doc》由会员分享,可在线阅读,更多相关《基于PCA及其改进算法的研究Word下载.doc(60页珍藏版)》请在冰点文库上搜索。
第1章绪论 1
1.1本文选题背景及意义 1
1.2国内外研究现状 2
1.3本文主要内容及章节安排 2
第2章PCA算法理论基础 4
2.1引言 4
2.2PCA算法理论概述 7
2.2.1K-L变换 8
2.2.2SVD分解 8
2.2.3特征向量的选取 10
2.2.4PCA算法流程框图 11
2.3本章小结 13
第3章PCA改进算法理论基础 14
3.1引言 14
3.22DPCA算法理论概述 14
3.2.12DPCA算法理论 15
3.2.2基于2DPCA的图像压缩 17
3.2.3基于2DPCA的图像重建 17
3.2.42DPCA的流程框图 18
3.3MatPCA算法理论概述 19
3.3.1MatPCA简介 19
3.3.2MatPCA算法 20
3.3.3MatPCA算法流程 21
3.4ModulePCA算法概述 22
3.4.1ModulePCA算法简介 22
3.4.2ModulePCA算法 22
3.4.3ModulePCA算法流程 23
3.5本章小结 24
第4章MATLAB程序实现 25
4.1概述 25
4.2PCA、2DPCA和MatPCA程序实现 25
4.2.1总体算法框架代码 25
4.2.2训练图像 26
4.2.3测试图像 30
4.2.4添加噪声 30
4.2.5压缩图像 32
4.2.6图像重建 33
4.3ModulePCA程序实现 35
4.3.1训练图像 35
4.3.2测试图像 37
4.3.3压缩图像 38
4.3.4图像重建 39
4.4本章小结 39
第5章实验结果及分析 40
5.1
概述 40
5.2PCA、2DPCA和MatPCA结果分析 40
5.2.1总体框架 40
5.2.2PCA算法实验分析 41
5.2.32DPCA算法实验分析 46
5.2.4MatPCA算法实验分析 48
5.3ModulePCA结果分析 51
5.3.1ModulePCA算法总体框架 51
5.3.12ModulePCA算法实验分析 51
5.3本章小结 53
结论 54
致谢 55
参考文献 56
西南科技大学本科生毕业论文
第1章绪论
1.1本文选题背景及意义
目前数字图像的数据量呈爆炸型增长,占用大量的存储和传输等资源[1],主要是由于图像数据中的相邻像素的相关性高,图像数据表示中存在着大量的冗余;
与此同时在图像的特征表示的过程中,维数很高,使人难以理解数据之间的关系,使得存储、传输、处理变得更加困难,在处理、计算过程中必须分配很大的存储空间以及消耗大量的计算时间,维数数据处理成了问题的瓶颈。
压缩后的图像传输到目的地后,要经过解压缩恢复到原图像才可以使用,因此有必要对压缩的图像和数据进行重构。
采用的主成分分析(PCA)方法能够出去除去图像数据的相关性[3],将图像信息浓缩到几个主要成分的特征图像中,有效地实现了图像的压缩;
同时可以根据主成分多少恢复不同的数据图像,满足不同层次对图像压缩与重建的需要。
一般将所有的图像称为图像空间(ImageSpace),图像被认为是该空间中的一个元素。
要对图像空间中的所有图像进行研究是非常复杂的,而且大部分也不是我们感兴趣的。
一个方法是将图像空间分成若干子空间,对其中的子空间进行统计分析。
这些子空间中,研究人员最为感兴趣的就是人脸图像。
得到了学术界的广泛关注和深入研究。
特征提取和降维是人脸压缩的关键步骤。
在主成分分析的算法中存在着很多不足,对面部表情变化很大和光线很强的等许多外界条件变换很大以及图片的维数很高的情况下普通的PCA压缩方法不能够达到很好的效果。
所以研究PCA的改进算法就非常有必要,改进算法可以大大的提高压缩的效率,以及提高重建时的准确度。
图像数据量越大,占用的存储、处理和传输等资源就越多。
为了提高图像存储、传输和处理效率,必须对图像中的冗余数据进行压缩。
压缩后的图像传输到目的地后,要经过解压缩恢复为原始图像,因此又需要对压缩的图像数据进行重构。
1.2国内外研究现状
目前学术界已经发展了多种经典的压缩图像算法,待处理的人脸图像本质上都是多维的人脸图像,而PCA是基于向量的数据降维算法,因此使用PCA对这些对象压缩的必须将原始观测的张量对象向量化。
原始数据因此丢失了空间结构信息和关联信息等高维特性,针对上述问题本文提出的基于张量的主成分分析方法考虑到了输入的张量样本的结构信息对原始张量数据直接进行压缩有利于人脸图像的判别分析。
主成分分析(PrincipalComponentAnalysis,PCA)也称主分量分析[2],它是一种利用降维思想,将原有的多个变量通过线性变换转化为少数几个新的综合变量的统计分析方法。
这些新变量(主成分)互不相关,能有效地表示原变量的信息(不丢失或尽量少丢失原有变量的信息)。
主成分分析方法能除去图像数据的相关性,将图像信息浓缩到几个主要成分的特征图像中,有效地实现图像的压缩;
基本的PCA图像压缩算法,虽然可取得较理想的压缩比,但该方法对保留特征个数的选取没有一个好的标准,信噪比十分低且对非线性非平稳图像信号没进行考虑。
主要研究基于PCA的人脸图像压缩及重建方法,同时针对PCA方法的不足,研究PCA图像压缩及重建改进方法,并通过MATLAB实现基于PCA及其改进算法的图像压缩及重建。
1.3本文主要内容及章节安排
本文的工作主要是研究分析了以人脸图像为载体的图像压缩与重建的PCA算法及其相关的改进算法。
文中重点研究了基于PCA的改进算法包括2DPCA、MatPCA和ModulePCA三个改进算法。
从而很好的实现对人脸图像的压缩以及重建。
全文共分为四章,内容和组织结构如下:
第一章,绪论。
首先介绍了本文的选题背景以及选题意义,然后重点介绍了该课题在国内外的研究状况,最后介绍了本文的主要内容及各章节安排。
第二章,PCA算法理论基础。
首先对PCA算法的理论进行介绍,包括K-L变换、SVD分解等基础知识。
第三章,PCA改进算法理论基础。
介绍PCA改进算法的主要理论包括2DPCA、MatPCA以及ModulePCA的相关知识。
第四章,MATLAB程序实现。
在上一章节的理论基础上,通过MATLAB将算法实现,在这章将给出主要的一部分代码。
并且会对代码进行一些简要的说明。
本章将实现PCA、2DPCA、MatPCA和ModulePCA这四种算法。
第五章,给出算法的实验结果。
并且对PCA、2DPCA、MatPCA和ModulePCA这四种算法人脸压缩以及重建的效果进行分析对比,通过对比总结出这四种算法的性能。
最后,结论。
总结了本文的工作,并提出人脸压缩与重建技术存在的问题并展望下一步研究方向。
第2章PCA算法理论基础
本章首先对人脸图像压缩以及重建的相关背景知识做了一个介绍,然后提出了PCA算法及其改进算法的相关理论,包括K-L变换,SVD分解,以及相关的压缩图像与重建图像的基础理论。
2.1引言
图像的基本特性之一是图像的像素之间是高度相关的[1],因此很多图像信息是冗余的。
这也是图像压缩技术基础。
图像压缩技术第一步就是去除像素间的这种相关性,现在已经有两种技术可以达到这个目的,其中一种是预测(Predictive)技术,另外一种方法是变换技术(Transform)。
图像压缩技术据此可以分成两个大类,一类是预测编码,一类是变换编码。
另外因为图像数据还存在编码冗余,所以还可以用普通的数据压缩手段例如变长编码来进一步增加人脸图像压缩性能。
实际人脸图像压缩系统中经常都采用这些压缩技术,一个经典的压缩系统如图2.1所示,包括量化器,符号编码器以及转换器。
其中转换器负责去除原始人脸图像的冗余信息(利用变换技术或者预测),而量化器用于更进一步增加转化后图像数据的编码冗余(同时也使得人脸图像的部分信息变成不可恢复,所以无损压缩没有该步骤),对于符号编码器则主要负责将量化后的图像数据进行编码传输。
在图像重建端,压缩的数据首先通过符号解码器来得到解压后的量化数据,然后通过反向转换器恢复出压缩的人脸图像。
2.1经典的图像压缩系统
输入序列
基于预测技术的图像压缩方法,一般按照行-列的顺序依次对图像每个像素点进行编码。
对每个像素点进行编码之前,要先通过当前和先前行已经编码的像素点对当前像素点进行预测值,这个预测值代表了人脸图像中的冗余信息。
把预测值与实际值进行相减得到差值,也被称为预测误差(PredictionError)。
最后仅对预测误差进行压缩编码。
由于每个像素的预测值仅用到了先前已经编码的像素,这个编码过程也被称为是因果的。
基于因果编码的解码过程如下:
首先通过先前解码的像素得到当前像素的预测值,然后再加上编码过程存储的预测误差得到像素的解码值。
由于在因果的编码过程中,像素的预测值仅从先前编码的像素得到,因而只利用其上方和左边的像素。
如果预测时同时利用下面和后边的像素则可以得到更高的预测精度,同时也意味着更高的压缩比,这就是非因果预测。
然而这种方式使得编解码过程不能顺序的进行。
非因果图像预测编码过程一般还包含了图像的变换或需要求解大量的联立方程。
这些编码技术一般都是对图像整个进行编码,或者按块进行编码。
基于预测技术的典型编码技术有差分脉冲调制(DPCM,DifferentialPulseCodeModulation)和向量量化(VectorQuantization)。
经典的基于预测的压缩系统如图2.2所示[1]。
符号编码
量化器
-
+
预测器
图像重建
解码器
2.2经典基于预测的压缩系统
图像压缩的另一种途径是通过变换。
在变换编码中,图像首先通过某些变换(线性或非线性)得到一系列变换系数,再将这些系数量化后得到压缩图像。
在解码端,编码的系数首先经过反量化,然后再通过反变换得到实际图像。
典型的基于变换的压缩系统如图2.3所示。
变换编码的基本原理是图像在变域中信号能量趋向于向低频聚集。
这表现为变换系数大量集中于零值附近,只有少部分系数较大,这也被称为系数分布的稀疏性。
根据变换系数的这一特点,通常在量化后对量化系数进行一次熵编码(变长编码),以进一步增加图像的压缩比,典型的基于变换编码的系统如下图所示。
基于变换的经典图像压缩技术有JPEG和JPEG2000,前者基于DCT变换,而后者基于小波变换。
量化
变换
分成大小的子块
输入图像
压缩图像
重建图像
反变换
合并子块
符号解码
图2.3典型的基于变换的压缩系统
预测编码和变换编码都有着各自的优势,前者实现相对简单,而且算法本身是对图像的局部信息自适应的;
后者一般具有更高的压缩比,但是代价是变换计算的复杂度较高,这同时也使得实现较为复杂。
评价图像压缩方法通常分两个方面,压缩性能以及压缩图像质量[4]。
其中压缩性能常以压缩比或者相对数据冗余大小来衡量,定义为原始数据总量与压缩数据总量之比,而相对数据冗余定义如下压缩后数据减少量相对于原数据量的百分比:
(2-1)
(2-2)
此外还常用每个像素所用比特数(BPP,Bitsperpixel)来衡量压缩性能,定义为压缩数据总量与总像素数的之比,单位为bits/pixel。
(2-3)
压缩图像的质量可以通过主观或者客观质量评价得到。
其中比较常见的客观质量评价手段有均方根误差、信噪SNR和峰值信噪比PSNR,分别是下面的公式(2-4)~(2-6)定义[7]:
(2-4)
(2-5)
(2-6)
其中和力分别表示解压图像和原始图像;
PSNR计算公式中,n为每个像素所占比特数,常见的为8比特,MSE表示均方根误差。
虽然客观质量评价手段方便易行,但是并不能真正反映出人对图像的主观感受,因此主观质量评价更为准确。
主观质量评价可以让多个观察者对图像进行打分,最后取其平均得到。
由于主观质量评价需要大量人员参加,因此实际实行并不方便。
图像质量评价正是在这种背景下产生的一个图像处理领域的新热点,人们通过各种方法试图设计和人眼感官一致的图像质量评价算法。
本文中主要采用均方根误差来评价图像重建质量的好坏。
2.2PCA算法理论概述
基于PCA的人脸图像的压缩与重建算法是统计学中的一种方法,这种方法主要是通过对图像的主要成分的统计和计算,然后将较高维的图像映射到低维的图像空间中从而实现图像的压缩。
当要实现图像的重建的时候,只需要将压缩时候实现图像压缩的逆矩阵与压缩后的图像相乘就可以实现图像的重建。
基于PCA的图像压缩算法相对于传统的图像压缩算法较为简单[5]。
2.2.1K-L变换
K-L变换是PCA方法的主要过程之一,要实现人脸图像的压缩与重建就要用到K-L变换。
K-L变换方法经典,而且实现起来比较容易。
基本的PCA方法在对人脸图像压缩前首先要挑选一些图像作为训练图像。
假设要训练的图像的尺寸为,那么它的所有列的像素可以首尾相接串起来。
这样,每一幅图像可以拉伸成一个长为的列向量,它可以看成维空间中的一个点。
由于所训练的图像彼此之间都具有很多相似的地方,所以这些向量在这一超高维空间中的分布并不是随机或者杂乱无章的,它们彼此之间具有很强大的相关性,可以对其进行主成分分析(K-L变换),即用一个低维子空间描述这些图像,同时又不丢失关键信息[6]。
假设空间描述这些训练图像集含有M副图像,令为第个训练样本图像向量,为所有训练样本图像的平均图像向量,即:
(2-7)
主成分分析需要训练样本集的总体散布矩阵,即协方差矩阵:
(2-8)
或
(2-9)
是一个维数为的矩阵,主成分分析方法需要计算其特征值和正交归一化的特征向量由于实际应用中都会非常大,直接计算式非常困难的。
为此下面的SVD分解可以很好的解决这个问题。
2.2.2SVD分解
SVD分解是处理维数很高的矩阵经常用的方法[8],通过SVD分解可以有效的将很高维的矩阵分解到低维空间里面来进行求解。
通过SVD分解我们可以很容易的求解出高维矩阵的特征值和其相应的特征向量。
下面就是SVD分解的相关的具体理论。
设A是一个秩为r的维矩阵,则存在两个正交矩阵:
(2-10)
(2-11)
以及对角阵:
(2-12)
且
满足
其中,为矩阵和的非零特征值[9];
和分别为和对应于的特征向量。
上述分解成为矩阵A的奇异值分解(SingularValueDecomposition,SVD),A的奇异值为。
由于可表示为:
(2-13)
故,构造矩阵
(2-14)
容易求出其特征值及相应的正交归一化特征向量从上述推论可知,的正交归一化特征向量为:
(2-15)
这就是图像特征向量。
它是通过计算较低维矩阵R的特征值和特征向量而间接求出的。
将特征值按照从大到小的顺序排列:
其对应的特征向量为。
这样,每一幅人脸图像都可以投影到由张成的子空间中。
因此,每一幅人脸图像对应于子空间中的一个点。
同样,子空间中的任意一点也对应于一幅图像。
有了这样一个由张成的子空间,任何一幅人脸图像都可以向其投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置。
换句话说,任何一幅人脸图像都可以表示为的线性组合,其加权系数即是K-L变换的展开系数,也可以称为该图像的代数特征。
对于任意待压缩的人脸图像,可以通过向特征子空间投影得到其系数向量:
(2-16)
得到的系数向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PCA 及其 改进 算法 研究
![提示](https://static.bingdoc.com/images/bang_tan.gif)