基于变换的图像压缩算法探讨.docx
- 文档编号:12961300
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:8
- 大小:21.64KB
基于变换的图像压缩算法探讨.docx
《基于变换的图像压缩算法探讨.docx》由会员分享,可在线阅读,更多相关《基于变换的图像压缩算法探讨.docx(8页珍藏版)》请在冰点文库上搜索。
基于变换的图像压缩算法探讨
基于变换的图像压缩算法探讨
摘要:
介绍了图像压缩的相关知识,探讨了基于变换的图像压缩算法,并对离散傅里叶变换(DFT)、离散余弦变换(DCT)和K-L变换作了简要分析,通过提取一定的变换后的系数对DCT和K-L两种变换进行了逼近性能的对比,在MATLAB上对它们进行了仿真。
实验结果表明,这些方法能够实现图像的压缩功能,其信噪比和压缩比都在正常水平,恢复图像效果较理想。
关键词:
图像压缩;变换;逼近性能;信噪比;压缩比
1图像压缩原理
人类传递信息的主要媒介是语音和图像。
图像是能为人类视觉所感知的信息形式或人们心目中的有形想象。
据统计,在人类接受的信息中,视觉信息约占80%,俗语“百闻不如一见”就反映了图像在信息感知中的独到之处。
可是,从技术角度来讲,相对于语音处理技术,图像处理技术起步较晚,在第三代计算机问世后,才得到了迅速发展。
目前,图像处理技术发展迅速,应用领域也越来越广。
图像压缩编码的过程可以概括成图1所示的3个步骤,原始图像经过映射变换后的数据再经量化器和熵编码器成为码流输出。
现对编码框图做下列说明:
映射变换的目的是通过映射改变图像数据的特性,使之更有利于压缩编码。
在实际应用中,映射变换的方法种类繁多,如:
在变换编码中,先将图像分成若干个n×n大小的子块,然后进行映射变换。
在这种情况下的映射变换是对各子块进行某种正交变换。
而量化和编码是对变换后所得的系数进行的。
事实上,映射变换是图像编码的一个核心部分,它决定了量化和编码的对象类型。
所以可以据此对编码方法进行分类。
一个好的映射变换通过与合适的量化器相配合,应能充分消除图像信源的各种冗余度。
在限失真编码中要对映射后的数据进行量化,量化总会造成某些信息丢失,形成失真,即量化失真或量化噪声。
为使失真小,应量化得精细,但压缩比就高不了。
这是一对矛盾。
应选用恰当的量化级数和量化曲线形状来缓解这对矛盾。
量化器的引入是图像编码产生失真的根源。
在要求复原图像与原图像完全一致的无失真编码器中必须不用量化器。
熵编码是用来消除符号统计冗余度的,它一般不产生失真。
理想的情况是使编出的码流的平均码长等于量化后数据的信息熵。
常用的编码方法有许多种,如Huffman编码、算术编码(ArithmaticCoding)、行程码(RLC)和变长码(VLC)等。
上述三个步骤之间是相互联系相互制约的。
对有些编码方法,如预测编码或变换编码,映射变换后数据量并没有减少,甚至因动态范围的加大而使数据量略有增加。
但它为后两步做了准备,使它们能有效发挥作用。
而在模型编码中,经映射变换后得到的模型参数,其数据量已大大小于原始图像,即第一步已实现了很大的压缩。
后面的量化编码则是做进一步的压缩。
其情况和波形编码、变换编码有很大的不同。
如何评价一个图像压缩算法的性能?
对许多供人观察的照片和屏幕显示的图像系统来说,人的视觉系统是其最后终端,也即图像的信宿。
人眼类似于一个光学系统,但它并不是普通意义上的光学系统,因为它受到神经系统的调节。
人眼分辨景物细节的能力是有限的,对于亮度的响应具有对数非线性性质,并且其对亮度信号的空间分辨率大于对色度信号的,并对高频信号不敏感,从空间频率的角度来说,人眼还具有带通型线性系统的特征。
这里引入两个能描述图像压缩算法性能的指标:
峰值信噪比:
PSNR=10×log10((255×255)/MSE)(对于255×255图像)
MSE为均方误差,指的是各值与平均值之差平方的期望值。
压缩比:
CR=n/n\-d其中n为原始图像总数据量,压缩编码后为n\-d
无失真编码又称信息保持熵编码,或叫做熵保持编码。
它要求在解码端复原图像和原图像完全一致,没有任何失真,或在编解码过程中不丢失任何信息。
这种编码由于没有利用视觉特性,其压缩比要比限失真编码小得多。
评估一种图像压缩算法的性能,可从质量、效率和计算复杂度三个方面综合考虑。
因为图像的最终接收者是人,因此主观评价,即根据人的主观感觉对图像的质量做出评定的重要的,也是目前国际上普遍采用的方法。
主观评价大体上可分为两类:
绝对评价和相对评价。
在绝对评价中,观察者根据一些事先规定好的评价尺度或自己的经验,对被评价图像做出质量判断;在相对评价中,由观察者将一批图像由好到坏进行分类,对图像进行互相比较后评出分数。
与此同时,客观评价的评价标准可以计算,并且有好多种,尽管人们希望它能和主观评价尽量一致,但目前还没有找到一种合乎主观评价的逼近公式。
图像压缩算法的效率指的是在压缩了一定量大小的数据时所用时间的长短,它反映了该算法压缩图像的快慢。
而图像压缩系统的复杂度是指为实现编解码算法所需的硬件设备量,典型的可用算法的运算量及需要的储存量来度量。
2基于变换的图像压缩
在图1所示的编码框图中,若用某种形式的正交变换来实现此框图中的映射变换,则这种编码方式就称为变换编码。
图像信号一般具有较强的相关性,如果所选用的正交矢量空间的基矢量与图像本身的主要特征很接近,那么在这种正交空间中描述这一图像信号将会更简单些。
从本质上说,图像经过正交变换后之所以能够实现数据压缩,是因为经过多维坐标系适当的旋转变换后,把散布在各个原坐标轴上的原始图像数据集中到新坐标系中的少数坐标轴上了,从而为后继的量化和编码提供了高效数据压缩的可能性。
为了保证平稳性和相关性,同时也为了减少运算量,在变换编码(DFT,DCT)中,一般在发送端的编码器中,先将原图f(m,n)分成子像块,然后对每个子像块进行正交变换,形成变换域中的系数阵列F(s,t)样本。
(系数)选择器再选择其中的若干主要分量进行量化、编码和传输。
接收端解码器经过解码、反量化后得到带有一定量化失真的变换系数F′(s,t),再经过反变换就得到复原图像f′(m,n)。
显然,复原图像也带有一定的失真,但只要系数选择器和量化器编码器设计得好,这种失真可限制在允许的范围内,因此变换编码是一种限失真编码。
2.1离散傅里叶变换(DFT)
二维傅里叶变换是二维线性系统分析的一个有力工具,它将图像从空域变换到频域,很容易分析图像的各频域成分,从而进行相应的处理。
把傅里叶变换理论同其物理意义相结合,有助于解决大多数图像问题。
一幅静止的数字图像可以看作是二维数据阵列。
因此,数字图像处理主要是二维数据处理。
对M×N的数字图像阵列f(x,y),其二维离散傅里叶变换的形式定义为:
F(u,v)=∑M-1x=0∑N-1y=0f(x,y)e-j2π(ux/M+vy/N)
(1)
式中,u=0,1,2…M-1,v=0,1,2...N-1
其反变换为:
f(x,y)=1MN∑M-1u=0∑N-1v=0F(u,v)ej2π(ux/M+vy/N)
(2)
式中,x=0,1,2…M-1,y=0,1,2…N-1
二维傅里叶变换具有可分离性,所以二维离散傅里叶变换的计算可以分为两步一维傅里叶变换来实现。
快速傅里叶变换是在分析离散傅里叶变换中多余运算的基础上,消除重复工作的指导思想下得到的,所以,在运算中大大节省了计算量,达到了快速运算的目的。
2.2离散余弦变换(DCT)
在傅里叶级数展开式中,如果函数对称于原点,则其级数中将只有余弦项函数。
若将给定的序列延拓成偶对称序列,其离散傅里叶变换也将只含余弦项。
这样就提出了另一种图像变换的方法——离散余弦变换(DCT)。
由于离散余弦变换具有把图像的重要可视信息都集中在变换的一小部分系数中,所以,DCT变换在图像的压缩中非常有用,是JPEG(JointPhotographicExpertGroup)标准的基础。
二维离散余弦变换的矩阵表示为:
[F(u,v)]=[A][f(x,y)][A]\+T
[f(u,v)]=[A]\+T[F(x,y)][A]
式中[f(u,v)]是空间数列矩阵,[F(x,y)]是变换系数阵列,[A]是变换矩阵。
基于DCT的图像压缩是一种简单、有效的图像压缩方法,它允许使用各种快速算法,且编码简单。
但是其比特率不能严格控制,并且复原图像存在严重的方块效应。
方块效应是变换编码中最令人头痛的失真,因为人眼对此非常敏感,克服的方法有以下两种:
①反滤波法:
解码后作低通处理,将块边界处的“突跳”滤平,不过代价是图像细节减少了;
②交叠分块法:
在将图像分块时,块的划分使块与块之间有交叠部分,如一个像素重叠。
解码复原图像后,再对块边缘进行平均。
这样做的代价是由于块增多而使码率略有增加。
2.3K-L变换
若将图像看作随机场,则可根据它的统计特性进行正交变换。
数据压缩的程度取决于图像信号中冗余度的解除程度,冗余度可借助相关性度量,如果一种变换能将图像信号中各像素间存在的相关性完全解除,从数据压缩角度来看,该变换无疑是一种最佳变换。
K-L变换(Karhunen-LoeveTransform)是建立在统计特性基础上的一种变换,也称特征向量变换、主分量变换或霍特林变换(hotelling)。
K-L变换的突出的优点是去相关性好,它根据具体的图像统计特性(图像的协方差矩阵)来决定它的变换矩阵,对图像有最好的匹配效果,能将信号在变换域的相关性全部解除,是最小均方误差意义下的最佳变换。
K-L变换在数字图像压缩技术中占有重要地位,常用来作为标准来衡量其他变换性能的好坏。
如果一个离散信号由N个样值组成,则它可以表示为一个维向量,设以X表示它,即
X={X(m)},m=0,1.2,…,N-1(3)
对X进行正交变换
Y=TX(4)
其中,Y是变换后的变量(变换系数向量),T是变换矩阵。
Y也是一个N维向量,表示为:
Y={Y(u)}u=1,1,2,…,N-1
若变换矩阵T是由X的协方差矩阵的特征向量{Φ\-i}(∑\-XΦ\-i=λ\-iΦ\-i,λ\-i是矩阵∑\-X的第i个特征值)组成。
即T=[Φ\-0Φ\-1…Φ\-\{N-1\}]\+T,则变换Y=TX称为K-L变换。
K-L变换有如下性质:
①去相关性,即K-L变换使变换后的矢量信号Y的各分量互不相关;
②能量集中特性。
这里所指的能量集中特性是对n维矢量信号进行K-L变换后,最大的方差将集中在前m个分量中的这样一种特性(m<n);
③最佳性。
K-L变换是在均方误差测量下,失真最小的一种变换;
④尚无快速算法。
K-L变换虽然具有MSE意义下的最佳性能,但至今尚无快速算法。
正如在定义中描述的一样,K-L变换需要先知道图像的协方差矩阵并求出特征值,而求特征值与特征向量并非易事,维数高时甚至求不出,即使能借助于计算机求解,也很难满足实时处理的要求,而且从编码应用看还需要将这些信息传输给接收端。
这就是K-L变换在工程实践中不能广泛使用的原因。
人们一方面继续寻求特征值与特征向量的快速算法,另一方面则寻找一些不是“最佳”,但也有较好的去相关与能量集中性能、而实现却容易的多的一些变换方法。
而K-L就常常作为对这些变换性能的评价标准。
3逼近性能对比
在前面的工作中,分别对DCT变换、K-L变换做了介绍,并分析了其性能。
但是,这两种方法之间的性能对比并不能通过上述工作表现出来,因此,在MATLAB的环境下,通过在把图像分成若干个8×8子块后,再经过各种变换,并按各变换后相应的系数分布规律来提取一定的主要系数以获取该变换在图像压缩方面的逼近性能。
原始图像系数矩阵经过DCT变换后,其主要能量集中在变换后系数矩阵的左上角,而在K-L变换中,变换后系数矩阵的能量则集中在每一个8×8子块所构成的向量的靠前部分。
因此,可以按照以上规律来分别提取DCT及K-L变换后每个子块的32、16、8、4、2、1个系数,用这些系数来还原图像,并比较取相同个系数时的信噪比,对lena.bmp图像的实验结果如图2、3所示:
图2对DCT变换后的矩阵保留不同系数个数时的复原图像
图3对K-L变换后的矩阵保留不同系数个数时的复原图像
表1lena.bmp的两种变换的逼近性能比较(信噪比)
每个子块保留的系数个数[]DCT[]K-L
32[]34.4788[]36.1825
16[]29.8167[]30.9843
8[]27.1012[]27.4773
4[]24.1546[]24.4291
2[]20.7109[]22.2998
1[]19.4207[]20.1451
由此可见,对于lena.bmp来说,总体来说K-L变换的
逼近性能最好,其次是DCT变换。
但是K-L变换在仿真时耗时较多,而DCT相对较为迅速,故在一般的图像压缩中不用K-L变换。
4结束语
本文主要探讨了图像压缩及基于变换的图像压缩算法的基本知识,介绍了DCT变换、K-L变换等基于变换的图像压缩算法,并通过MATLAB实现对DCT和K-L变换进行逼近性能的比较,具体为通过对图像进行相应的变换后,提取其中能量相对较大的若干个系数来进行图像重构,比较这些重构图像的信噪比,来得到不同变换方法的逼近性能,进而比较两种方法的优劣。
参考文献:
[1]沈世镒,吴忠华.信息论基础与应用[M].北京:
高等教育出版社,2004.
[2]余松煜,张文军,孙军.现代图像信息压缩技术[M].北京:
科学出版社,1998.
[3]耿玉静,赵华.图像压缩技术的发展现状与趋势[J].中国科技论文在线,2010(10).
[4]何明一,卫保国.数字图像处理[M].西安:
西北工业大学出版社,2006.
[5]吴乐南.数据压缩[M].北京:
电子工业出版社,2005.
[6]罗建国.基于DCT算法变换的图像压缩技术研究[J].科技广场,2008
(2).
[7]王文峰,宋凯.基于K-L变换的图像压缩编码算法研究[J].大众科技,2008(3).
[8]赵文俊,董慧敏,朱智民.基于MATLAB的图像压缩编码仿真实现[J].机电工程,2007(10).
[9]于宁宁,赵宗平.基于MATLAB的图像压缩技术的研究[J].中国科技论文在线,2006(4).
[10]钱裕禄,周雪娇.基于DCT的JPEG图像压缩编码算法的MATLAB实现[J].浙江万里学院学报,2002
(1).
[11]余秋菊.基于DCT变换的JPEG图像压缩及其MATLAB实现[J].计算机与网络,2009(9).
[12]邓薇.MATLAB函数速查手册[M].北京:
人民邮电出版社,2008.
[13]JIANKUNLI,JINLI,ANDC.-C.JAYKUO.LayeredDCTstillimagecompression[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,1997
(2).
[14]MunenoriOizumi.PreprocessingmethodforDCT-basedImage-compression[J].IEEETransactionsonConsumerElectronics,2006(3).
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 变换 图像 压缩 算法 探讨
![提示](https://static.bingdoc.com/images/bang_tan.gif)