数字图像处理总结.docx
- 文档编号:11923638
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:18
- 大小:140.43KB
数字图像处理总结.docx
《数字图像处理总结.docx》由会员分享,可在线阅读,更多相关《数字图像处理总结.docx(18页珍藏版)》请在冰点文库上搜索。
数字图像处理总结
1月9号上午10:
00
单选20分10个,简答15分3个,简单计算20分综合45分3个一、数字图像基础
数字图像:
图像定义为二维函数f(x,y),x,是空间坐标,f(x,y)是点(x,y)的幅值。
是指由被称作像素的小块区域组成的二维矩阵。
像素包括两个属性:
位置和灰度数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
数据量很大,便于计算机处理与分析。
在计算机中通常是二维数组f(x,y),或M*N的二维矩阵
图像处理系统的基本组成和基本原理:
数字图像处理系统:
能够完成图像处理和分析任务的系统。
主要有:
图像输入设备,执行分析与处理图像的计算机及图像处理机,输出设备及存储系统中的图像数据库等。
是以计算机为核心的技术。
由图像输入设备、图像处理设备、图像输出设备三部分组成。
用计算机对用矩阵表示的数字图像进行各种运算,目的是改善图像的质量,使其更便于人们观察,适合机器识别。
低级图像处理:
主要对图像进行各种加工以改善图像的视觉效果、或突出有用信息,并为自动识别打基础,或通过编码以减少对其所需存储空间、传输时间或传输带宽的要求。
输入是图像,输出是图像,即是图像之间进行的变换中级图像处理:
主要是对图像中感兴趣的目标进行检测和测量,一伙的客观信息,从而建立对图像中目标的描述,是一个从图像到数值或符号的过程。
输入时图像,输出是数据,属性
高级图像处理:
在中级图像处理的基础上,进一步研究图像中各目标的性质和它
们之间相互的联系,并得出对图像内容含义的理解(对象识别)及对原来客观场景的解释(计算机视觉),从而指导和规划行动。
以客观世界为中心,借助知识、
经验等来把握整个客观世界。
“输入是数据,输出是理解
图像数字化:
采样,量化(编码)
采样:
空间坐标值的离散化。
对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构,所形成的微小方格称为像素点.一副图像就被采样成有限个像素点构成的集合。
采样频率是指一秒钟内采样的次数,它反映了采样点之间的间隔大小。
采样频率越高,得到的图像样本越逼真,图像的质量越高,但要求的存储量也越大。
量化:
灰度值的离散化。
要使用多大范围的数值来表示图像采样之后的每一个点。
量化的结果是图像能够容纳的颜色总数,它反映了采样的质量。
香浓取样定理(奈奎斯特采样定理):
为了不失真地恢复模拟信号,采样频率应
该不小于模拟信号频谱中最高频率的2倍。
fs>2fmax
像素间关系:
4邻域,D邻域,8邻域neighbors;相邻的像素点。
4邻接,8邻接,m邻接adjacency;
4连通,8连通,m连通;通路path;
连通区域(ConnectedComponent),连通集;
4-邻接:
如果q是N4(p),且p和q属于V;
8-邻接:
如果q是N8(p),且p和q属于V;
m-邻接:
p和q属于V,
(1)q是N4(p);
(2)q是Nd(p)且N4(p)与N4(q)
的交集没有属于V的像素。
像素p(x,y)和q(s,t)间的距离:
1
22—
(1)欧氏距离:
De(p,qr[(x-s)(y-t)]2
(2)D4距离(城市距离):
Dgq)二x-s+y-t
(3)D8距离(棋盘距离):
Ds(p,q)=max(x-s,y-t)
1.邻域:
数字图像中,邻域分为4邻域和8邻域,4邻域就是某个(x,y)点的上下左右四个点,8邻域再加上左上右上左下右下四个点。
如果p在q周围的8个点内,就是p在q的8邻域内。
2.邻接:
邻接算是包含了邻域,如果说p和q是邻接,那么p和q必须互在邻域内,而且这两个的像素还要都在同一个集合V1内。
(什么叫都在集合V1内:
假如集合V1包含{012345},这五个数代表的是像素值,而p值为2,q值为6,那它们两个就不在同一个集合V1内,当然如果有个集合V2,它俩可能也在另一个集合V2内)数字图像中常见的邻接有三种,4邻接、8邻接和m邻接。
如果p在q的4邻域内,且q和p的值都在V中,那么p和q是4邻接的,8邻接概念一样。
m邻接不太一样,如果q和p互在8邻域内,p和q都在V内,且q的4邻域和p的4邻域的共同覆盖的点不在V内,则p和q是m邻接的。
m邻接是为了消除8邻接的二义性而引进的。
3.通路:
如果从(x0,y0)点到(xn,yn)点,其中的每个点与前后都是K邻接的
(K代表4、8、m),则说这两个点之间存在一条K通路,注意一定要强调明白K,而n是这个通路的长度,如果(x0,y0)和&门沖)是重合的,那么说这是一条闭合通路。
4.连通:
对于图像中的某一个像素子集U和其中的两个点p和q,如果p和q之间有一个由U中全部元素构成的通路,那就说p和q是连通的
5.连通集:
接上,对于U中的元素p,U中能连通到p的元素的集合叫做U的连通分量,如果U只有一个连通分量,那么U就是一个连通集。
6.区域:
令T是图像中的某一个子集,如果T是一个连通集,那么称T是一个区域。
理解这些概念的时候,不能孤立的看,要和图像分割的过程结合起来看,比如图像的前景和背景,就是跟区域有关的。
假设一幅图像中有M个不连接的区域,且它们都不接触图像的边界,令R1代表这M个区域的并集,令R2代表其补集,那么R1中的所有点就是图像中的前景,而R2中的所有点就是图像的背景。
二、空域增强
灰度变换:
也被称为图像的点运算,对图像的计算仅依赖于当前像素和灰度变换函数,指根据某种目标条件按一定变换关系逐点改变源图像中每一个像素灰度值的方法。
其目的是为了改善画质,使图像的显示效果更加清晰。
改善图像的质量,使图像能够显示更多的细节,提高图像的对比度(对比度拉伸),有选择的突出图像感兴趣的特征或者抑制图像中不需要的特征,可以有效的改变图像的直方图分布,使像素的分布更为均匀
s=T(r)T是灰度变换函数,r是变换前的灰度,s是变换后的像素。
图像反转,是图像线性变换的一种,可以得到图像负片,能够有效的增强图像的暗色区域中的白色或者灰色细节
对数变换,扩展图像中的低灰度区域,压缩图像中的高灰度区域,能够增强图像中的暗色区域的细节;反对数变换与此相反。
对数变换还有个重要作用是,能够
压缩图像灰度值的动态范围,在傅立叶变换中能够显示更多的变换后的频谱细节伽马变换,主要用于图像的校正,根据参数r的选择不同,能够修正图像中灰度
过高(r>1)或者灰度过低(r<1)。
空域滤波:
是基于邻域处理的增强方法,直接在图像所在的二维空间进行处理,
即对每一个像素的灰度值进行处理。
它应用某一模版对每个像素与其周围邻域的所有像素进行某种数学运算得到该像素的灰度值,新的灰度值的大小不仅域该像素的灰度值有关,而且还与其领域内的像素值值的灰度有关。
从处理效果上可以把空域滤波分为平滑空域滤波和锐化空域滤波
平滑滤波:
平滑滤波能减弱或消除图像中高频率的分量,但不影响低频率的分量。
因为高频分量对应图像中的区域边缘等灰度值具有较大、变化较快的部分,平滑
滤波将这个分量滤除可以减少局部灰度的起伏,使图像变得平滑。
经常用于模糊处理和减小噪声。
平滑空域滤波:
线性和非线性
线性平滑滤波:
线性平滑滤波所用的卷积模板均为正值,分为邻域平均和加权平均两种。
邻域平均:
将原图中一个像素的灰度值和它周围邻近的像素的灰度值相加,然后
将求得的平均值作为新图中该像素的灰度值。
邻域平均法的模板为:
中间的黑点表示以该像素为中心元素,即该像素是要进行处理的像素。
在实际应用中,也可以根据不同的需要选择使用不同的模板尺寸,如3X3、
5X5、7X7、9X等。
邻域平均处理方法是以图像模糊为代价来减小噪声的,且模板尺寸越大,噪声
减小的效果越显著。
邻域平均法具有良好的噪声平滑效果,是最简单的一种平滑方法。
加权平均:
对于同一尺寸的模板,对不同位置的系数采用不同的数值,一般认为离对应模板中心像素近的像素应对滤波有较大的贡献,所以系数较大;而模板边界附近的系数应比较小。
[111]
h=1/10*[121]
[111]
非线性平滑滤波:
线性滤波在消除图像噪声的同时也会模糊图像的细节,利用非线性平滑滤波可在消除图像中噪声的同时较好的保持图像的细节。
最常用的非线性滤波是中值滤波。
中值滤波的基本步骤是:
(1)将模板在图中漫游,并将模板中心与图中某个像素位置重合;
(2)读取模板下各对应像素的灰度值;(3)将这些灰度值从小到大排成一列;(4)找出这些灰度值里排在中间的一个;(5)将这个中间值赋给对应模板中心位置的像素。
对椒盐噪声很有效,非线性,减少模糊。
锐化滤波:
锐化滤波能减弱或消除图像中的低频分量,但不影响高频分量。
因为低频分量对应图像中灰度值缓慢变化区域,因而与图像的整体特性如整体对比度和平均灰度值有关。
锐化滤波能使图像反差增加,边缘明显,可用于增强图像中被模糊的细节或景物边缘。
包括梯度算子、罗伯茨算子、索贝尔算子、拉普拉斯算子、高提升滤波
索贝尔算子:
-1-2-1-101
各向同性
000-202
121-101
高提升反锐化直方图:
可看作概率密度函数直方图均衡化的基本思想是把原始图的直方图变换为均匀分布的形式,这样就增
加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。
缺点:
1)变换后图像的灰度级减少,某些细节消失;
2)某些图像,如直方图有高峰,经处理后对比度不自然的过分增强。
直方图归一化normalization:
直方图均衡化equalization:
基本思想是把原始图像的直方图变换为“均匀分布”的形式,这样就增加了像素灰度值的动态范围,从而达到增强图像整体对比度的效果。
累计分布函数计算
图像的加减:
三、频域增强
二维DFT傅里叶变换
■一个图像尺寸为MXN的函数<(对)的离散傅立叶变换尸也刃;
M-]jV-1
f(m,v)=££几工,)厂
x=0y^D
■F(utv)的反变换:
iM-\N1
m,刃=J正工w
MNw=qv=o
二维DFT傅里叶变换
(3)=@0)位置的傅里叶变换值为
尸(0,0)
M-IN-1
工工/
(2)二/
(2)
x-0v-0
即几2)的均值,原点(啦)的傅里叶变换是图像的
平均灰度牡AX0.0)称为频率谱的直流分量(系数),
其它F(g)值称为交流分量(交流系数人
二维傅里叶变换特点:
线性,可分离性,平移性,旋转不变性
共轭对称,关于原点对称,和的可分离性,可用一维FFT、计算,平移性,
图像频谱的特点:
图像的频率是表征图像中灰度变化剧烈程度的指标,在噪声点
和图像边缘处的频率为高频。
主要能量在低频区,高频能量很少,低频对应平滑变化,高频对应快速变化,
F(0,0)=
哈达玛(Hadamard)矩阵是由+1和-1元素构成的且满足Hn*Hn'=nl(这里Hn'为Hn的转置,I为单位方阵)n阶方阵。
WHT
离散余弦变化DCT:
KL变换:
信息压缩:
WHT-->DFT-->DCT-->KLT
简单到困难:
WHT-->DCT—DFT-->KLT
平滑滤波也叫低通滤波
理想型滤波会出现振铃,1阶巴特沃斯没有“振铃“,随着阶数增大,振铃现象越发明显。
带通带阻了解
滤波半径越大,模糊越小
锐化:
特点
高频加强滤波:
同态滤波:
反射(变化快)照射(变化慢)模型
同时抑制动态范围,增强对比度
伪彩色pseudcolor增强是把黑白图像的各个不同灰度级按照线性或非线性的映射函数变换成不同的彩色,得到一幅彩色图像的技术。
假彩色falsecolor合成又称彩色合成。
根据加色法或减色法,将多波段单色影像合成为假彩色影像的一种彩色增强技术。
合成彩色影像常与天然色彩不同,且可任意变换,故称假彩色影像。
合成方法很多,主要有光学法、电子光学法、染印
法等。
四、图像退化和复原
图像复原和图像增强的区别:
图像复原需要知道图像退化的相关知识,重构出原始图像,由评判准则,是一个
客观过程;图像增强不需要知道图像退化知识,是主观过程
咼斯噪
Uniformnoisemodel
ThePDFofjniformnoiseisgivenby
Thenneanandvarianceofthisdensityfunctionaregivenby_a+b.(b.a)2
U=b二
212
Uniformnoisemodelisnotsooftenusedtodescribepracticalsituation呂;butitisquiteusefulasthebasisfornumerous「endomnumbergeneratorsthatareusedinsimulations.
g(x,y)=h(x,y)f(x,y)(x,y)G(u,v)=H(u,v)F(u,v)N(u,v)
退化函数:
H(u,v)
退化函数的估计:
观察法,试验法,数学建模法
由退化函数H退化的图像复原的最简单的方法是直接做逆滤波,设图像退化前的傅里叶变换为F(u,v),退化后的傅里叶变换为G(u,v),系统函数即退化函数的傅里叶变换为H(u,v)。
逆滤波,就是用退化函数除退化图像的傅里叶变换,得到退化前图像的傅里叶变
换的估计。
噪声很小是影响很大,限定在原点附近
维纳滤波(wienerfiltering)一种基于最小均方误差准则、对平稳过程的最优估计器。
这种滤波器的输出与期望输出之间的均方误差为最小,因此,它是一个最
佳滤波系统。
它可用于提取被平稳噪声所污染的信号。
维纳滤波器是一种线性滤波器。
当没有噪声时和逆滤波结果一样
图像几何变换又称为图像空间变换,它将一幅图像中的坐标位置映射到另一幅
图像中的新坐标位置.
需要两部分运算:
首先是空问变换所需的运算,如平移、旋转和镜像等,需要用它来表示输出图像与输入图像之间的〈像素〉映射关系:
此外,还需要使用灰度插值算法,因为按照这种变换关系进行计算,输出图像的像素可能被映射到输入图像的非整数坐标上。
几何变换:
平移,镜像,旋转,像素插值,图像配准图像平移就是将图像中所有的点按照指定的平移量水平或者垂直移动。
图像缩放是指图像大小按照指定的比率放大或者缩小旋转一般是指将图像围绕某一指定点旋转一定的角度。
旋转通常也会改变图像的大小。
最近邻插值,双线性插
双线性插值的平滑作用会使图像的细节退化,而其斜率的不连续性则会导致变换产生不希望的结果.这些都可以通过高阶插值得到弥补,高阶插值常用卷积来实现。
五、图像压缩编码
熵的概念:
压缩:
无失真压缩,失真压缩三种冗余:
编码冗余,像素间冗余,心理视觉冗余保真度准则:
客观,主观
Threepartofthesourceencoder
MaoperisdesignedtoreduceinterDixwlredundancies・(eg.Run-lengthcoding).
QuLantizerreducespsychovisualredundancies,thisoperationisirreversible.(IGSquantization).
Symboloncoderreducescodingredundancy,thisoperationisreversible-(variable-lengthcoding).
Imagecompressionmodels
FIGURES3A曲utralconiprcssiDnsyslcinnudel
Theencoderismadeupofasourceencoder,whichremovesinputredundancies,andachannel巳ncoder,whichincreasesthenoiseimmunityofthesourceEncoder'soutput*
ThedecoderincludesachanneldecoderfallowedbyasourcedecoderIfthechannelbetweentheencoderanddecoderisnoisefree,thenthechannelencoderanddecoderareomitted・
Threepartofthesourceencoder
Mapoerisdesignedtoreduceinterpixelredundancies.(eg.Run-lengthcoding)・
Quantizerreducespsychovisualredundancies,thisoperationisirreversible.(IGSquantization)
Symbolencoderreducescodingredundancy,thisoperationisreversible・(va「iable・lengthcoding).
哈夫曼编码:
算术编码:
预测编码:
位平面编码:
变换编码:
框图
无失真预测,流程,框图
误差:
颗粒误差,斜率扩展
子图象大小选择,比特分配:
区域编码,门限编码
六、中级处理(提取图像属性):
图像分割;图像表示和描述(边界描述,区域描述)基于灰度级的两个性质:
非连续性,相似性
-1
一1
-1
T
-1
-1
二1
边缘检测:
梯度算子,罗伯茨算子,索贝尔算子,
拉普拉斯算子:
一般不直接用于边缘检测,因为噪声敏感,不能检测边缘方向
-1
7
-1
T
0
1
0
0
0
-1
0
1
1
1
I
-1
0
3
Prewill
-1
-2
-1
-1
□
1
□
0
0
-2
D
2
1
2
I
-1
0
!
Sobel
Lecture18:
DetectionofDiscontinuities
RoleofLaplacianoperatorinsegmentation
TheLaplaciangenerallyisnotusedinitsoriginalformforedgedetectionforseveralreasons:
1.UnaGGeptablysensitivetonoise;
2.Thedoubleedgesitproduceswouldcomplicatesegmentation;
3.Unabletodetectedgedirection.
Therole:
4・Usingitszerocrossingpropertyforedgelocation;
2.Usingitforthecomplementarypurposeofdecidingwhetherapixelisonthedarkorlightside.
Ideallyanedgeisasetofconnectedpixelswhichislocatedatanorthogonal
steptransitioningraylevel.
Butinpractice,optics,samplingandotherimageacquisitionimperfectionsyieldedgesthatareblurredandmorethanonepixelthick.
门限:
基本门限(iterativ)迭代门限
基本全局门限,
自动门限的获得:
1选一个T的初值
2用T分割图像,分成了两类像素
f^y)<T^G2
3对区域Gl,G2计算平均灰度"r"
4新门限
5重复②一④,直至T值变化小于7;
霍夫变换:
运用两个坐标空间之间的变换将在一个空间中具有相同形状的曲线或
直线映射到另一个坐标空间的一个点上形成峰值,从而把检测任意形状的问题转
化为统计峰值问题。
一条直线在直角坐标系下可以用y=kx+b表示,霍夫变换的主要思想是将该方程
的参数和变量交换,即用x,y作为已知量k,b作为变量坐标,所以直角坐标系下
的直线y=kx+b在参数空间表示为点Kb),而一个点(x1,y1)在直角坐标系下表示
为一条直线y仁x1•k+b,其中k,b)是该直线上的任意点。
为了计算方便,我们将
参数空间的坐标表示为极坐标下的丫和B。
因为同一条直线上的点对应的(丫,8)
是相同的,因此可以先将图片进行边缘检测,然后对图像上每一个非零像素点,在参数坐标下变换为一条直线,那么在直角坐标下属于同一条直线的点便在参数空间形成多条直线并内交于一点。
因此可用该原理进行直线检测。
种子区域生长法是从一组代表不同生长区域的种子像素开始,接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中,并将新添加的像素作为新的种子像素继续合并过程,直到找不到符合条件的新像素为止。
该方法的关键是选择合适的初始种子像素以及合理的生长准则。
区域分裂合并法的基本思想是首先将图像任意分成若干互不相交的区域,然后再按照相关准则对这些区域进行分裂或者合并从而完成分割任务,该方法既适用于灰度图像分割也适用于纹理图像分割。
表示一个区域:
外部性质(边界,形状),内部结构(区域性质)
表示边界:
描述边界长度,直线走向,边界凹面数目等
(区域描绘子)表示区域:
描述(内部)面积,周长,致密性(周长平方除以面
积),平均数,中值等
边界表示方法:
链码(4连通链码,8连通链码)
是用曲线起始点的坐标和边界点方向代码来描述曲线或边界。
利用一系列具有特定长度和方向的相连的直线段来表示目标的边界。
Normalized(起点归一化)归一化链码:
把原链码看作由各方向数构成的自然数,将该码按一个方向循环,使其构成的自然数最小,此时形成归一化链码,
原链码具有平移不变性(平移时不改变指向符),但当改变起点S时,会得到不同的链码表示,归一化链码既具有平移不变性,也具备唯一性,但不具备旋转不变性。
(旋转归一化)一阶差分链码:
通过计算相邻两个元素方向变化(逆时针方向)的数字得到。
就是前一个数字变化到后一个数字需要经过的步数,注意是逆时针方向,比如1->1经过0步,1->0经过7步归一化的一阶差分链码(形状数):
就是对一阶差分链码
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 总结