书签分享收藏举报版权申诉 / 23

立即下载加入VIP,免费下载

当前位置：首页 > 工程科技 > 城乡园林规划 > 图像分析复习提纲答案.docx

图像分析复习提纲答案.docx

文档编号：9408190
上传时间：2023-05-18
格式：DOCX
页数：23
大小：236.73KB

图像分析复习提纲答案.docx

《图像分析复习提纲答案.docx》由会员分享，可在线阅读，更多相关《图像分析复习提纲答案.docx（23页珍藏版）》请在冰点文库上搜索。

图像分析复习提纲答案.docx

图像分析复习提纲答案

第一二章：

1、什么是视觉？

什么是计算机视觉？

视觉

1）、定义：

人（动物）通过光学（非光学）特性来感知理解客观世界空间结构、特点以及运动规律的功能；

2）、没有眼睛也可以具有视觉，只要它能够感知客观世界的空间结构与存在；

3）、光学特性不是视觉感知的唯一手段。

计算机视觉的目标与任务

1）、定义：

研究用计算机来模拟人和生物的视觉系统功能的技术学科；

2）、目标：

使计算机具有感知周围视觉世界的能力。

让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力，从而达到识别、理解的目的。

3）、任务：

图象的获取、预处理、图象分割与表示与描述、识别与分类、三维信息理解、景物描述、图象解释。

红色部分就构成了图像分析的研究内容。

2、没有眼睛也可以具有视觉，只要它能够感知客观世界的空间结构与存在

3、计算机视觉有哪三个层次？

1）低层处理：

基于图象特征抽取与分割阶段；

2）中层模型表达：

基于物体的几何模型与图象特征表达；

3）高层理解及描述：

基于景物知识的描述与理解。

4、低层处理的内容有那些？

图象增强，图象复原，图象重建，图象分割

5、为什么要进行中层建模？

从图象中抽取几何特征建立模型，用于描述物体的形状。

（本答案是理解而来，课件中找不到直接答案）

6、高层分析要做那些工作？

高层语义解释根据景物中的物体模型以及物体间的各种限制关系等知识,对低层和中层处理产生的结果进行识别、推理,并产生全局一致的解释。

7、人的视网膜上存在哪三种不同的锥状细胞？

视网膜上存在三种不同的锥体细胞，分别对红、绿、蓝三种颜色的光线最敏感，它们的相互作用产生各种颜色视觉。

对白天的光线敏感，并能分辨色彩，可以在较快的时间内完成光电转换。

在晶状体周围紧密排列着。

8、视网膜的作用是哪些？

答:

起光电传感器的作用，由感光细胞（锥状细胞和杆状细胞，吸收光量子，输出生物电流）按一定的结构排列组成；

9、锥状细胞（红、绿、蓝）：

对白天的光线敏感，并能分辨色彩

可以在较快的时间内完成光电转换。

在晶状体周围紧密排列着

10、杆状细胞：

对暗淡的光线敏感

11、什么是视觉的对比性或适应性？

试举例说明？

视觉的适应性或对比性：

依赖于相对比较而得到感受的视觉特性；这种受到先前模式影响的视觉适应性或对比性成为视觉的“惰性”；

举例子：

马赫带现象：

视觉的对比性夸大实际明暗度变化的现象；亮度；色彩；边界；形状、大小；运动。

12、金字塔数据结构所需要的数据量是原始图像的多少倍？

图象的M-pyramid金字塔结构是一个图象序列{ML,ML-1,...,M0}，其中ML是具有原图象分辨率的图象，即原图象本身，然后依次降低一倍分辨率得到该图象序列。

当原图象的分辨率是2的整数幂时，M0则仅对应于一个象素。

当需要对图象的不同分辨率同时进行处理时，可以采用这种数据结构。

分辨率每降低一层，数据量则减少4倍，因而处理速度差不多提高4倍。

M-pyramid金字塔结构存储所有图象矩阵需要的象素个数为：

所以约为原来图像数据量的1.33倍

线性空间，线性变换

卷积：

一种将两个函数组合生成第三个函数的运算，卷积刻画了线性移不变系统的运算

积分

称为

与

的卷积积分

一个离散系统，如果系统特征T[·]不受输入序列移位（序列到来的早晚）的影响，则系统

称为移不变系统。

由于很多情况下序号对应于时间的顺序，这时也把“移不变”说成是“时不变”。

用数学式表示：

对于y（n）=T[x（n）]

若y（n-

）=T[x（n-

）]（2.16）

则系统是移不变的

时域是信号在时间轴随时间变化的总体概括

频域是把时域波形的表达式做傅立叶变化得到复频域的表达式，所画出的波形就是频谱图。

是描述频率变化和幅度变化的关系

二维离散傅里叶变换

r校正：

（L为输入的图像，I为输出的图像，C和r为常数）

13.什么是图像增强？

图像增强是指按特定的需要，突出一幅图像中的某些信息，同时削弱或去除某些不需要的信息的处理方法。

图像增强技术主要包括：

直方图修改处理、图像平滑处理、图像尖锐化处理等。

按作用域来分，有空间域方法和频率域方法。

14.什么是图像的灰度直方图？

灰度级的直方图就是反映一幅图像中的灰度级与出现这种灰度的概率之间的关系的图形。

直方图的性质

１．所有的空间信息全部丢失。

２．每一灰度级的像素个数可直接得到。

15、直方图均衡化的基本思想是什么？

（PPT_Chapter_3_Page42）

答：

直方图均衡方法的基本思想是对在图像中像素个数多的灰度级进行展宽，而对像素个数少的灰度级进行缩减。

从而达到清晰图像的目的。

算法：

1）对于有G个灰度值的M*N个像素的图像，建立一个长度为G的数组H[G]初始化为0；

2）逐点扫描图像，当某像素点的灰度值为p时，H[p]=H[p]+1；

3）从0开始对H中的每个元素进行一下操作：

H[0]=H[0]；H[k]=H[k-1]+H[k]

4）设置函数T（p）=Round（（G-1）/（M*N）*H[p]）；

5）重新扫描图像，对图像上的每一个点用函数T进行计算，并用该函数的结果代替原来的灰度值，得到一个输出图像

16、什么是颜色直方图？

答：

色彩直方图是高维直方图的特例，它统计色彩的出现频率，即色彩的概率分布信息。

通常这需要一定的量化过程，将色彩分成若干互不相重叠的种类。

17、试阐述卷积定理。

（附）

答：

二维函数g记为f*h，定义为g（x,y）=

卷积定理：

F{（f*h）（x,y）}=F（u,v）H（u,v）

F{f（x,y）h（x,y）}=F*H（u,v）这些对于连续函数域的傅里叶变换的性质同样适用于离散图像，只是将公式中的积分变为求和。

利用卷积定理进行快速匹配，边界特征描述，图像压缩以及若干其他领域。

18、为什么要进行伽马校正，试解释伽马校正的基本原理。

19、一个好的平滑方法应该是既能够去掉图像中的寄生效应又不使图像的边缘轮廓和线条模糊。

（PPT_Chapter_3_Page61）

20、试阐述均值滤波器（中值滤波器）的算法？

答：

所谓的均值滤波是指在图像上对待处理的像素给一个模板，该模板包括了其周围的邻近像素。

将模板中的全体像素的均值来替代原来的像素值的方法。

K近邻均值（中值）滤波器：

1）以待处理像素为中心，作一个m*m的作用模板。

2）在模板中，选择K个与待处理像素的灰度差为最小的像素。

3）将这K个像素的灰度均值（中值）替换掉原来的像素值。

21、什么是低通滤波？

什么是高通滤波？

答：

低通滤波：

是指滤除高频部分，让低频部分通过。

去掉噪声使图像得到平滑。

高通滤波：

是指滤除低频部分，让高频部分通过。

加强图像的边缘及急剧变化部分，达到图像锐化的目的。

22、适用图像说明如何在频率域尽兴滤波？

（附）

答：

23、什么是图像尖锐化？

（图像尖锐化的作用是什么？

）

答：

增强图像的边缘及灰度跳变部分。

24、试阐述理想低通（高通）滤波的基本思想。

答：

2）理想高通滤波器

25、试阐述同态滤波的基本思想。

答：

同态滤波增强依靠图像的照度/反射率模型作为频域处理的基础，是一种在频域中同时将图像亮度范围进行压缩和将图像对比度进行增强的方法。

因为一般照度分量在空间缓慢变化，而反射分量在不同物体的交界处急剧变化，所以图像对数的傅里叶变换后的低频部分主要对应照度分量，而高频部分主要对应反射分量，以上特性表明可以设计一个对傅里叶变换的高频和低频分量影响不同的滤波函数H（u,v）,使其在一方面减弱低频而另一方面加强调频，最终结果是同时压缩了图像整体的动态范围和增加了图像相邻各部分之间的对比度。

26、什么是图像复原？

其基本思想是什么？

答：

定义：

利用退化图像的某种先验知识来重建或恢复被退化的图像.

基本思想：

为了改善给定的图像的质量，在图像复原的过程中，人们试图利用某种先验知识，把一幅模糊图像，经过计算机处理，使其恢复或接近原来真实的图像，我们把这种去掉图像模糊的过程就认为是一个复原问题。

27、什么是图像重建？

其基本思想是什么？

答：

定义：

图像重建是指根据物体横剖面的投影数据，经过计算机处理后，得到物体横剖面的图像，这种从数据到图像的处理技术。

图像重建的思想：

将物体的投影图像通过某种方法映射到一个线性空间，以此来重建物体更高层次或维数的信息。

傅里叶变换重建的基本思想：

对于一个三维（或二维）物体，使它的二维（或一维）投影的傅立叶变换恰与此物体的傅立叶变换的主体部分相等。

通过将投影进行旋转和傅立叶变换，可以首先构造整个傅立叶平面，然后，只需再通过傅立叶反变换，就可以得到重建后的物体。

28 、为什么要进行图像分割？

答：

图象分割就是把图象分成一些有意义的区域，它的主要目标是将图像划分为与其中含有的真实世界的物体或区域有强相关性的组成部分。

29、图像分割的特点有那些？

1）均匀性；

2）连通性；

3）边缘完整性；

4）反差性

上述特点是指导图象分割的基本出发点，其中区域内部特性的均匀性是最重要的准则之一。

30、什么是全局门限？

什么是局部门限？

答：

门限是输入图像f到输出图像g的如下变换：

其中T为阈值。

全局门限是根据整幅图像f确定的T=T（f）;

另一方面，局部阈值是与位置相关的T=T（f,fc）,其中fc是阈值赖以确定的图像部分。

一种选择是将图像f划分为子图像fc，在每个子图像中独立地确定一个阈值。

此时，如果在某些子图像中不能确定阈值，可以根据其相邻子图像的阈值插值得到。

然后每个子图像就可以依据局部阈值来处理。

31、试给出Ostu二值化方法的算法？

答：

算法对输入的灰度图像的直方图进行分析，将直方图分成两个部分，使得两部分之间的距离最大，划分点就是求得的阈值。

记T为前景与背景的分割阈值，前景点数占图像比例为w0，平均灰度为u0；背景点数占图像比例为w1，平均灰度为u1。

则图像的总平均灰度为：

u=w0*u0+w1*u1。

前景和背景图象的方差：

g=w0*（u0-u）*（u0-u）+w1*（u1-u）*（u1-u）=w0*w1*（u0-u1）*（u0-u1）

当方差g最大时，可以认为此时前景和背景差异最大，也就是此时的T是最佳阈值

32、什么是局部自适应二值化方法?

（附）

答：

局部自适应阈值化（adpaptivethresholding）是一种特殊的阈值化方法，它对于图像的不同区域使用不同的阈值。

这时的阈值是局部图像特征的函数，在图像范围内是变化的。

与全局门限分割不同的是，局部自适应门限分割有两种类型，一种是将图象划分成块，对于每一个图象块，利用全局门限分割技术，确定门限值，对该图象块进行用一个门限值进行分割。

另一种方法是对于图象的每一个像素都使用一个门限值，这种方法对于处理光照不均匀的情况有较大的优点。

多光谱阈值化

1）将整个图像初始化为单个区域；

2）给每个谱段计算一个平滑的直方图。

在每个直方图中找到一个最显著的峰，确定两个阈值分别对应于该峰两侧的局部最小值。

根据这些阈值将各个谱段的每个区域分割为子区域。

将各个谱段的每个分割投影到多光谱分割中。

下一步处理的区域是这些在多光谱图像中的区域。

3）对于图像的每个区域重复第二步，直至每个区域的直方图只含有一个显著的峰

分层数据结构下的阈值化

1）将图像表示成金字塔数据结构；

2）从最高层开始在金字塔的所有层的一切像素中，顺序地搜索显著像素。

如果检测到一个显著像素，则设置一个阈值T为：

其中c是显著像素的灰度值，ni是它在金字塔当前层中的3*3邻域的灰度值。

将该阈值作用在对应的完全分辨率的图像部分上。

3）继续按照步骤2所描述的金字塔进行搜索。

33、试给出基于四叉树的分裂与合并图像分割算法；

答：

34、试阐述皮肤颜色人脸检测算法？

答：

1）将检测图象转化为标准化的（r,b），对图像上的每个点：

2）求出概率图象：

遍历图像，求出该图像分别关于r、b的均值向量m=

其中

，h（x,y）=（R+B）/（R+G+B）

定义（p+q）阶中心距为：

则该图像关于r、b的协方差矩阵为：

继而求出概率图像对图像上的每个点，用

（其中X为该点的r和b组成的2*1向量）代替原来的f（x,y）

3）为概率图像设定一个阈值T，当概率图像的f（x,y）>=T时，f（x,y）=1，否则为0；

4）计算二值图像当中值为1的连通域，得到多个候选连通域，这些连通域就可近似地视为人的皮肤区域。

35、什么是像素的邻接关系？

答：

对于图像中的两点p与q，若q存在p的8邻域或者4邻域，则称p与q具有邻接关系。

36、什么是连通？

什么是连通域？

答：

对于图像中的两点p与q，若存在一条路径连接p与q，则称p与q是连通的。

若对于图象中的一个点集，中间任意两点都是连通的，则称该点集组成一个连通域。

37、什么是连通域标记？

为什么要进行连通域标记

答：

连通域标记就是对每一个连通域用阿拉伯数字标记，生成的标号图象的像素值就是像素所在连通域的标号。

进行连通域标记之前的图像一般是经过阈值分割处理为二值图像。

二值图像中可能有多个连通区域。

进行图像检测的时候往往关心的是每个连通域各自的特性，为了提取不同区域的特征，就需要使用连通域标记的方法把不同的连通域区分开来。

连通域递归标记算法

逐行标记算法

38、试给出基于行程的连通域标记算法？

（1）第一遍扫描:

对于图象的第一行，将若干个新的标号赋予第一行的行程

（2）对于第二行及以后的行:

⏹假如在某一行的行程不和前面的任一行程相邻，则赋予一个新的标号;

⏹若正好和前面的一个行程相邻，那么就将它的标号赋予新的行程;

⏹若和前面不止一个行程相邻，则发生标号冲突；

（3）第二遍扫描：

根据等价表的信息对行程进行重新标注;

39、二值数学形态学的作用是什么？

它由那几部分构成？

答：

二值数学形态学作用：

用一定形态的结构元素去量度和提取图象中的形状和结构，以达到图像分析和识别。

由两部分构成：

二值图象B和结构元S。

它是由一组形态学的代数运算子组成。

基本运算包括膨胀，腐蚀，开启，闭合。

40、试给出图像膨胀（腐蚀）操作的算法（思想）？

答：

膨胀操作：

让结构元S的原点对图象进行扫描，一旦遇到二值图象的“1”像素时，结构元整体形状就与输出图象进行“或”运算。

腐蚀操作：

让结构元S的原点对准二值图象上每一个像素，如果结构元上每一个“1”像素全都覆盖二值图象上的“1”像素时，则将值“1”与输出图象进行“或”运算。

否则，置该像素为0

闭合操作：

先膨胀再腐蚀

开启操作：

先腐蚀再膨胀

33、.试利用开（闭）操作说明一个去除噪声填补空洞的方法？

腐蚀可以消除图像中小的噪声区域，膨胀可以填补物体中的空洞。

对一个图像先进行腐蚀运算然后再膨胀的操作过程称为开运算，反之，如果对一个图像先膨胀然后再收缩，我们称之为闭运算。

通常情况下，当有噪声的图像用阈值二值化后，所得到的边界是很不平滑的，物体区域具有一些错判的孔洞，背景区域散布着一些小的噪声物体，连续的开和闭运算可以显著的改善这种情况，这时候需要在连接几次腐蚀迭代之后，再加上相同次数的膨胀，才可以产生所期望的效果。

34、网络摄像机一般包括那三部分？

网络摄像机包含CCD模块、网络服务器及网卡三大部分。

（FromPPT）

35、什么是数字视频服务器？

什么是数字视频录像机？

他们之间的区别是什么？

数字视频服务器DVS是一种嵌入式视频处理、控制、传输设备。

其核心是运行实时操作系统的RISC嵌入式计算机和高性能视频DSP。

（FromPPT）

数字视频录像机DVR是一套进行图像存储处理的计算机系统，具有对图像/语音进行长时间录像、录音、远程监视和控制的功能.（Frominternet）

区别：

（Frominternet）

1.DVR可以单机系统运行操作，也具备网络界面，DVS则必须需要网络化的管理软件通过网络进行操作、使用和管理。

2.DVR更多考虑保证本地存储的可靠性，而DVS更多考虑网络的视频传输效率和质量，以及与外部系统的通讯规范。

36、试利用DVR构造一个简单的数字视频监控系统？

37、给出通过图象相减实现变化的检测算法？

设t1时刻的图像为f1（x,y），t2时刻的图像为f2（x,y），Out（x,y）为结果图像，T为阈值

1）对于图像中的每一个像素点，如果f2（x,y）-f1（x,y）>=T，则Out（x,y）=1；否则为0

2）计算Out（x,y）的连通区域，并去除当中较小的连通区域；

3）用一个小的圆模板对相邻连通域进行闭运算的溶合

4）提取溶合后的连通域的边界

5）输出Out（x,y）和边界

38、描述利用一阶递归滤波器实现运动目标提取的算法？

本文采用一阶递归滤波器来实现背景图象的自适应生成。

若当前原始图象前一帧为Fj-1，背景帧为Bj-1，则当前背景帧Bj可以采用一阶递归滤波器来生成：

Bj=（1–a）Bj-1+aFj-1;

其中0

运动区域可以通过计算当前原始帧与当前背景帧之间的差值的绝对值来提取，若此差值超过一个给定的门限值T，则认为此象素是活动的，即：

。

其中Mj为二值化的只包含运动区域的图象

形态滤波：

Sk=[（Mk●A3）〇A3]●A5（其中●和〇分别是形态学“闭”和“开”操作）

背景模型的更新原则：

1）背景模型对背景变化的响应速度要足够快

2）背景模型对运动目标要有较强的抗干扰能力

39、试利用直方图实现视频序列的分割？

1）首先需要采取一定的策略在视频图像当中选取一个视频序列，因为一段视频当中的帧数是比较多的，所以需要从中选取某些关键帧组成一个视频序列；

2）计算序列当中每一幅图像的直方图；

3）通过比较相邻图像的直方图差别来分割视频，如果前后两帧的直方图完全不同的话，可以推断出现了完全新的场景；如果前后两帧的直方图存在着部分的不相同，则说明场景中出现了新的物体或者是场景在缓慢地变化。

40、模拟矩阵的作用是什么？

模拟矩阵是相对数字矩阵而言的一种视频矩阵，它的视频切换在模拟视频层完成。

其作用：

实现对输入视频图像的切换输出。

准确概括那就是：

将视频图像从任意一个输入通道切换到任意一个输出通道显示。

41、试模拟矩阵设计一个模拟视频监控系统？

以下答案由靖隆提供，有问题的话请直接联系本人

这个问题老师问得不清楚，但是考试的系统设计题很有可能会考，考试的时候大致会这样问：

现有摄像头n个，监视器m个，请用设计一个视频监控系统。

一个视频监控系统的架构：

其中视频矩阵切换器的原理：

42.试阐述智能视觉视频监控的意义？

（第六章）研究意义：

摄像头已经广泛地安装在众多领域；

获得有价值观察输出所需要的人力却是非常的昂贵；

需要的是对活动视频进行24小时的计算机自动分析；

对现有视频监控系统进行升级换代所留有的市场空间十分巨大；

“911”事件突显本申请项目的紧迫性；

我国也存在一些不稳定因素；

区域的骨架：

对于一个区域S，B是它的边界，若存在某一个像素P能够在边界B上找出至少两个像素与P等距离，那么像素P必然属于骨架上的一个点。

43.什么是简单边界点？

什么是端点？

（第七章）

简单边界点：

对于S中的一个点P，如果其邻域中属于S的点只有一个与其相邻接的连通分量，则P为S的简单边界点。

不是

是

不是

0

1

0

1

0

1

0

1

0

p

1

0

p

1

0

p

1

0

p

0

p

0

1

0

1

0

1

0

1

0

端点：

S中的一个点P，如果其邻域中属于S的点只有一个1像素，则P为S的端点点。

0

1

0

1

0

p

0

p

0

1

p

0

p

1

0

p

0

1

0

44.细化算法的原则是什么？

S为代表线状区域的象素的集合，细化就是要在保持连通性且不减小形状长度的条件下消去S中那些不是端点的简单边界点，过程是按S的上（北）、下（南）、左（西）、右（东）四个方向顺序，反复进行扫描以消去可删除简单边界点，直到不存在可以消去的简单边界点为止。

45.试描述边界跟踪算法的基本思想？

（1）边界像素：

对于某一个像素P，如果其邻域（8或者4连通）中至少有一个0像素，则P就称为边界像素。

按照像素连通性的不同，有8连通边界与4连通边界两种。

（2）边界跟踪：

若已知前继点Q，当前点P，从P的邻域（8或者4）中按顺（逆）时针方向发现下一个边界点，直到遇到P点为止，跟踪结束；若图象有多个区域则需要对已经跟踪过的区域进行标记，以避免跟踪过程的重复。

曲线拟合：

把曲线分割成若干段，每一段采用简单的数学曲线（直线、圆、圆弧、椭圆等）去逼近。

这样曲线就可以采用分割点的坐标及其数学曲线函数来表示：

曲线拟合的核心问题就是的选择。

直线拟合

46如何生成链码？

如何利用它求出区域的周长？

设曲线坐标链为，若当前点为，后继点为，则通过计算：

由下表可以得到相应的链码：

周长计算公式：

面积计算公式：

47试阐述直线Hough变换的基本思想？

答：

把带参数的曲线从曲线空间映射到以参数为坐标的参数空间中，根据该空间中的一些特征反过来确定曲线的参数值，从而得到图象中各种边界的确定性描述。

其基本过程如下：

1）通过在图像中施加边缘检测子得到图像的边缘像素的集合，并初始化一个参数空间k-q，将参数空间上所有点（k，q）的函数值f（k，q）都初始化为0；

2）对每个边缘像素，计算出其在有限离散方向上的参数值（k，q），具体做法为，对于每个边缘像素的坐标（x，y）代入y=kx+q可得q=-kx+y对应于参数空间上的一条直线（注意：

k、q的取值是一个有限的集合），在参数空间上对直线q=-xk+y上的离散点（k，q），函数f（k，q）=f（k，q）+1；

3）由于在同一条直线上的边缘像素，其参数（k，q）将会相同，这就意味着，如果边缘像素上面存在直线的话，参数空间中某些点的函数值f（k，q）必然会比较大（因为直线上会有很多个对应同一个（k，q）的点，从而f（k，q）的累加次数也会增多），通过检测参数空间中f（k，q）值较大的点，我们就可以得到图像空间中对应的直线

上述就是直线Hough变换的基本思想

端点游程：

若一个游程的某一边没有相邻的游程，并且该游程的另外一边有一个游程与它相邻，那么这个游程就是端点游程；

交点游程：

如果一个游程的某一边有超过两个相邻的游程，那么这个游程就是交点游程

48、如何利用行程描述区域？

1）首先扫描图像，对图像进行行程编码，并对每一行（列）的行程赋予不同的区域编号；

2）逐行（列）检查行程，对于每一行（列）的行程，检查其相邻行（列）的行程，如果相邻行