数字图像处理复习

(ps: 为什么全都是重点啊!)

第二章:图像数字化

难点:

  1. 图像文件格式:不要求对图像文件存储格式有深入了解,要了解他们存储的方式是什么样的说得出大概就行
  2. 图像质量评价
    1. 主观评价:肉眼观察,不同的人对图像进行打分
    2. 可观评价:均方差,标准差,信噪比,结构相似度

1、采样间隔和量化等级,或采样与量化方式、参数的选择对图像质量有何影响?

采样间隔越密集图像质量越好,图像就会越接近与物理图像

量化等级越多,越接近我们实际的物理图像,灰度级越细致,反之则会损失掉较多的灰度信息,太少还会出现伪轮廓的情况

2、像素之间的关系

邻接:两个像素点有接触,比如4邻域,对角邻域,8邻域的中心像素与其他任意像素的关系

image-20220430144313290

邻接性,是在指定的灰度集合(可以包含多个灰度值)中,图像的像素邻域内的像素都为灰度集合的像素

image-20220430150703969

连通性:如果两个像素按照某种邻接关系存在一条连通的路径时,他们就是连通的。

区域:由连通的像素点所组成的点的集合称为一个区域

区域中的某一个像素如果存在某一个邻域不属于这一区域,则称他是该区域的边界点

边界:一个区域的全部边界点的集合组成该区域的边界

image-20220430152053416

边界和边缘的区别:边界如上所示,边缘是指图像中灰度存在差异的地方,通常指相邻像素之间的灰度值差异大于某一个阈值。

(ps:内部4个1像素中,左上角的那个也算边界点。漏掉了_(:з」∠)_)

3、数字图像中距离的度量有哪几种﹖给出对应的公式及计算方法

有两个像素点p,q,他们的坐标分别为(x1,y1),(x2,y2)(x_1,y_1),(x_2,y_2) ,则

欧氏距离

De(p,q)=(x1x2)2+(y1y2)2D_e(p,q) =\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}

城市距离

D4(p,q)=x1x2+y1y2D_4(p,q) = |x_1-x_2|+|y_1-y_2|

棋盘距离

D8(p,q)=max(x1x2,y1y2)D_8(p,q) = max(|x_1-x_2|,|y_1-y_2|)

image-20220430152848344

4、常用的图像存储的文件格式:BMP、GIF、JPEG、TIFF、PNG,各有什么优缺点?

  1. BMP:位图存储格式,采用位映射的方式存储,图像信息较丰富,但是占用磁盘空间大
  2. GIF:图像互换格式,允许设置背景的透明属性,使用无损压缩,一个GIF可以存储多幅彩色图像,可以形成简单的动画。
  3. JPEG:有损压缩格式,可以压缩到很小的存储空间并保持较好的图像质量。
  4. TIFF:支持多种色位和多种彩色模式,支持多钟压缩方式。
  5. PNG:可移植网络图形格式,位图文件存储格式,采用无损数据压缩算法,压缩比高,生成文件容量小。

5、图像打印的半调输出技术有哪两种﹖要输出256级灰度效果,需要多大的技术模板?

  1. 幅度调制技术和频率调制技术
  2. 5个灰度用2×2,10个灰度用3×3,256个灰度用16×16

6、图像质量评价方法如何分类﹖图像质量评价的客观方法主要有哪几种?各有什么特点?

主观评价和可观评价

客观方法:

  1. 均方误差:误差值越大,说明图像对应像素值整体差异大,图像质量差,反之均方误差小,说明图像质量好。均方误差为0,则被评价图像与参考图像完全一致
  2. 信噪比与峰值信噪比:不同图像,在均方误差相同的情况下,由于像素值不同,信噪比也很有可能不一样。
  3. 结构相似度:考虑了两幅图像的亮度,对比度和结构等罂粟对相似性的影响。

第三章:数字图像处理的数学基础(重点)

1、什么是线性系统和移不变系统﹖具有哪些重要性质

  1. 线性系统是对于任意两个输入x1,x2有两个输出f(x1),f(x2),若其满足f(x1)+f(x2)=f(ax1+bx2)=af(x1)+bf(x2)f(x1)+f(x2)=f(a\cdot x1+b\cdot x2)=af(x1)+bf(x2)则说明这是一个线性系统满足叠加原理(可加性,齐次性)
  2. 输出信号的函数形式不变,仅仅是输出信号的自变量平移了同样的长度T,则称该系统具有移不变性;或称为移不变系统。若线性系统满足移不变特性,则称为线性移不变系统。

2、调谐信号和传递函数的数学表达是什么?各有什么作用?频率、增益(幅值)、相位的物理意义是什么?

调谐信号实际上是用一个指数函数来表达我们这个线性当中很多的信号,因为指数也可以分解为正弦波,通过欧拉公式联系起来。作用:用调谐信号作为一种假设的输入
这个输入通过一个系统得到一个输出,当这个信号如果是一个单位阶要函数的时候,这个输出就是传递函数

频率:表示信号变化的周期

赋值:表示对信号的影响程度

相位:表示信号的偏移

3、卷积运算具有哪些重要性质﹖卷积运算和图像滤波有怎样的关系?

image-20220430161102246

滤波的目的是实现图像变换,其本质就是使用不同的卷积核对图像进行卷积运算。

4、图像的相关性如何描述﹖相关与卷积的关系?

相关性可以是指两幅图像的相关性,两者可以相等,如果不完全相等,可以用一个大于0小于1的数表示两者的差距。一个图像中两个不同物体不同之间的相关性,还有一幅图像中两个不同区域的相关性,其可以构成一种联合概率函数矩阵。

序列相关函数和卷积和的关系为rfh(m)=f(m)×h(m)r_{fh}(m)=f(-m)\times h(m),对于自相关函数择优rf(m)=f(m)f(m)r_f(m)=f(-m)*f(m)

5、二维线性系统和位置不变系统的数学表达,有哪些重要性质?

其本质就是将一个二维的系统,转化为在x和y上分别进行一维系统的计算,即两次一维运算。具有移不变性,若其还满足线性特征,则称为二维位置不变线性系统。

6、图像处理常用的矩阵运算有哪些?(复习线性代数)

加减乘除,转置,逆,行列式,内积

7、什么是梯度﹖二维梯度算子如何表达﹖离散梯度的简化算子有哪些?

高频信号和低频信号的边缘就是一种梯度,使用微分运算找到梯度。

8、什么是图像的灰度直方图﹖直方图具有哪些性质?

直方图代表了每一个灰度的取值占总像素的概率和数量的多少,是一种概率密度分布。

性质:

(1)直方图是一幅图像中各像素灰度值出现次数或频数的统计结果,它只反映该图像中不同灰度值出现的频率,而不能反映某一灰度值像素所在的位置信息,即直方图仅包含了该图像中某一灰度值的像素出现的概率,而丢失了其所在位置的信息。
(2)任一幅图像,都能唯一地确定一个与之对应的直方图。但不同的图像,可能有相同的直方图。也就是说,图像与直方图之间是一种多对一的映射关系。
(3)由于直方图是对具有相同灰度值的像素统计计数得到的,若某一幅图像由若干子图像区域构成,那么各子区域直方图之和就等于原图像的直方图。

9、数字图像的直方图的概念﹖图像的统计特征有哪些?图

像的信息量、灰度平均值、中值、值域、方差(均方差、标准差)等

标准差是一组薮据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.07分,B组的标准差为2.37分(此数据时在R统计软件中运行获得),说明A组学生之间的差距要比B组学生之间的差距大得多。

第四章:数字图像处理的数学运算(重点)

1、点运算的主要类型和特点是什么?有哪些应用?

点运算可以改变图像数据所占据的灰度值范围。但不会改变图像内的空间位置关系。

类型:

  1. 线性点运算:可以调节图像的亮度,对比度,以及图像求补。
  2. 非线性点运算:通过压低在中间灰度级出的对比度,将较亮和较暗部分的对比度加强。

应用:

  1. 对比度增强
  2. 光度学标定
  3. 显示标定
  4. 轮廓线
  5. 裁剪

2、图像的代数运算有几种类型﹖有哪些典型应用?

加:平均值降噪

减:消除背景影响,差影法图像分离,求梯度幅度

乘:通过图像掩码实现抠图效果

除:比值图像处理

3、图像的几何变换有位置变换(平移、镜像、旋转)和形状变换((放大、地小、错切),如何形成统一的数学表示﹖(会考计算题,图像的几何变换结果)

通过齐次方程,把所有的变换统一用矩阵的形式来表达。

4、如何理解齐次坐标﹖它有什么作用?

变换矩阵一般是方阵,在进行加减乘除与原图像进行矩阵运算的时候,矩阵行与列要遵循一定的关系才能进行运算。齐次方程坐标就是要解决这个问题。

5、为什么要进行灰度级插值?有哪几种灰度插值方法?

在进行图像放大时,少的像素要变成多的像素会出现像素空洞的情况,还有进行旋转时,也会发生角度的偏移而出现空洞。插值就是填补这些空洞的一个有效方法。

灰度插值:

  1. 最近邻插值
  2. 双线性插值
  3. 三次内插值

6、简述图像几何变换与图像变换的区别。

图像的几何变换:改变图像的位置、大小或形状。

图像变换:在不同空间对图像进行变化。

第五章:图像变换(重点)

1、什么是图像变换﹖图像变换的目的是什么?

图像变换:指在不同空间对图像进行的变换。为了快速和有效地对图像i行处理。

2、常用的图像变换有几种﹖不同的变换主要差异是什么?

图像变换的方法和种类很多,其原理和效果是不同的。由变换核决定不同类型的图像变换。

正弦型变换:傅里叶变换、余弦变换和正弦变换。方波型变换:哈达玛 (Hadamarn)变换、沃尔什(Walsh)变换、斜变换、小波变换。

基于特征向量的变换:主要包括Hotelling变换、K一L变换和SVD变换。

3、为什么说傅里叶变换是“数学棱镜”﹖典型函数的傅里叶变换的特点。

  1. 傅里叶变换将信号分成不同频率成份:直流分量和交流分量。
  2. 傅立叶变换在图像滤波中的应用:Fourier变换后的图像,中间部分为低频部分,越靠外边频率越高。因此,我们可以在Fourier变换图中,选择所需要的高频或是低频进行滤波。
  3. 信号变化的快慢与频率域的频率有关:噪声、边缘、跳跃部分代表图像的高频分量;背景区域和慢变部分代表图像的低频分量。
  4. 傅立叶变换在图像压缩中的应用:变换系数刚好表现的是各个频率点上的幅值,可以进行压缩编码。考虑到高频反映细节、低频反映景物概貌的特性,往往认为可将高频系数置为0,骗过人眼。

4、二维离散(数字图像)的傅里叶变换具有哪些性质﹖图像压缩运用了什么性质?

性质:线性特性,比例特性,平移性质,可分离性,周期性,共轭对称性,旋转不变形,微分性质,平均值性质,卷积定理,相关定理,Parseval定理

图像压缩利用了共轭对称性,只保存一半的信息,然后通过这一半能够还原另一半的信息。还利用了离散余弦变化进行压缩。

5、正弦信号的在频域中是由频谱和相角确定的一个点,从而有利于对信号进行分析与处理。

频域中低频信号幅值(傅里叶频谱)大,对应的能量谱高,频点亮;信号频率越高,对应的幅值越小,能量谱越小,频点越暗。

image-20220430170024558

第六章:图像增强(重点)

1、什么是图像增强﹖其目的和特点是什么?

图像增强:通过某种技术手段有选择地突出对某一具体应用有价值的信息,即图像增强只通过突出某些信息以增强对这些信息的辨识能力,而其他信息则被压缩了。

目的:根据应用需要突出图像中的某些“有用”信息,削弱或取出不需要的信息,以达到扩大图像中不同物体特征之间的差别,使处理后的图像对于特定应用而言,比原始图像更适合,或者使用图像的信息提取以及为其他图像分析技术奠定基础。

2、图像增强技术有哪些类型?

image-20220430171445239

3、什么是直方图均衡化﹖其处理过程包括哪些步骤﹖(这两个后面用题目说吧)

4、什么是直方图规定化技术﹖其处理包含哪些步骤﹖

原始 直方图 规定 直方图 Pr(rk)P_r(r_k)累加 Pz(Zk)P_z(Z_k)累加 结果
rkr_k Pr(rk)P_r(r_k) ZkZ_k Pz(zk)P_z(z_k) RkR_k VkV_k P(rk)P(zk)P(r_k) \rightarrow P(z_k)
r0=0r_0=0 0.29 z0=0z_0=0 0 0.29 0 0
r1=17r_1=\frac 17 0.24 z1=17z_1=\frac 17 0 0.53 0 0
r2=27r_2=\frac 27 0.17 z2=27z_2=\frac 27 0 0.70 0 0
r3=37r_3=\frac 37 0.12 z3=37z_3=\frac 37 0 0.82 0 0
r4=47r_4=\frac 47 0.09 z4=47z_4=\frac 47 0.27 0.91 0.27 0.29
r5=57r_5=\frac 57 0.06 z5=57z_5=\frac 57 0.43 0.97 0.70 0.24+0.17=0.41
r6=67r_6=\frac 67 0.02 z6=67z_6=\frac 67 0.19 0.99 0.89 0.12+0.09=0.21
r7=1r_7=1 0.01 z7=1z_7=1 0.11 1.00 1.00 0.06+0.02+0.01=0.09

结果就是对比VkV_k中与RkR_k最接近的值对应的灰度级的Pr(rk)P_r(r_k)的加和,Pz(zk)P_z(z_k)中要求为0的像素点,在结果中也一定为0,这个可以避免一些VkV_k相同不知道怎么处理的情况。

5、平滑滤波的作用是什么?什么是邻域平均滤波(均值滤波)﹖掌握其处理过程。 (均值滤波应该会有题目的)

作用:对图像的高频分量进行削弱或消除,增强图像的低频分量,平滑滤波一般用于消除图像中的随机噪声,从而起到图像平滑的作用。

6、中值滤波的原理是什么?掌握其处理过程。(应该有题目)

原理:利用一个奇数点的移动窗口,将窗口中心点的值用窗口各点像素值的中位数代替。

7、什么是图像锐化?其目的和原理是什么?

图像锐化就是突出图像的边缘纹理信息,可以通过锐化滤波器实现,它可以消除或减弱图像的低频分量从而增强图像中物体的边缘轮廓信息,使得除边缘以外的像素点的灰度值趋向于零。

8、图像锐化有哪些算法﹖罗伯特算子和拉普拉斯算子各有什么特点﹖、

  1. 梯度法,拉普拉斯算子,定向滤波
  2. 罗伯特算子是一种交叉差分的运算法则,拉普拉斯算子采用的是二阶偏导数

9、平滑模板和锐化模板有什么特点和不同之处?

平滑模板与锐化模板的不同之处在于,平滑模板各系数的符号均为正,因此平滑具有积分或求和的性质,而锐化模板各系数的符号则有正有负,而且模板系数的和正好为0,即锐化滤波算法具有微分或差分的性质。

10、频率滤波的原理及主要步骤。什么是截止频率?

阶数滤波,巴特沃斯滤波,指数滤波,梯形滤波(都是低通滤波 )

截止频率就是控制这些滤波中的哪一部分进行保留,哪一部分会被舍去。其中在截止频率内的频率将会被保留,反之则会被舍弃。

11、低通、高通、带同、带阻滤波有什么作用﹖决定滤波效果的关键因素是化么?

低通滤波:通过滤波器函数H减弱或抑制高频分量,保留低频分量,消除图像中的随机噪声,削弱边缘效应,起到平滑图像的作用。

高通滤波:对图像的边缘信息进行增强,起到锐化图像的作用。

带通滤波:允许一定频率范围内的信号通过而组织其他频率范围的信号通过

带阻滤波:可以对一定频率范围内的信号进行完全衰减,而允许其他频率范围内的信号通过。

关键因素:截止频率。

12、图像匹配中直方图匹配、模板匹配、形状匹配的原理是什么?各有什么特点﹖

  1. 直方图匹配又称为直方图规定化,是指将一幅图像的直方图变成规定形状的直方图而进行的图像增强方法。 即将某幅影像或某一区域的直方图匹配到另一幅影像上。使两幅影像的色调保持一致。
  2. 模板匹配是一项在一幅图像中寻找与另一幅模板图像最匹配(相似)部分的技术。这里说的模板是我们已知的小图像,模板匹配就是在一副大图像中搜寻目标。模板就是我们已知的在图中要找的目标,且该目标同模板有相同的尺寸、方向和图像,通过一定的算法可以在图中找到目标,确定其坐标位置。
  3. 形状匹配就是在形状描述的基础上,依据一定的判定准则,计算两个形状的相似度或者非相似度。两个形状之间的匹配结果用一个数值表示,这一数值称为形状相似度。形状相似度越大,表示两个形状越相似。非相似度也称为形状距离。与相似度相反,形状距离越小,两个形状越相似。

13、常用的彩色增强方法有哪几种﹖是如何实现的?

  1. 真彩色增强技术:真彩色处理中,被处理的图像一般通过全彩色传感器获取(彩色摄像机或彩色扫描仪等),对像按RGB三通道进行处理,并合成为真彩色。
  2. 假彩色增强技术:假彩色处理是一种尽量逼近真实色彩的人工彩色处理技术。把真实的自然彩色图像或遥感多光谱图像处理成假彩色图像。
  3. 伪彩色增强技术:伪彩色是指分配彩色给某一灰度范围或某一灰度值,以增强图像辨识能力。例如把黑白图象处理成伪彩色图象。

14、彩色图像有何特点?什么是真彩色图像和伪彩色图像?

真彩色图像指能真实反应自然物体本来颜色的图像,有彩色摄像机摄制,并由彩色监视器复原的彩色图像都可以认为是真彩色。

伪彩色是指分配彩色给某一灰度范围或某一灰度值,以增强图像辨识能力。

第七章:图像复原(重点)

1.图像退化的原因有哪些﹖图像复原的机理是什么?

原因:

  1. 成像系统镜头聚焦不准产生的散焦模糊;
  2. 相机与景物之间的相对运动模糊;
  3. 成像系统存在的各种非线性因素以及系统本身的性能造成的成像模糊;
  4. 射线辐射大气湍流等因素造成的几何畸变成像系统的像差、畸变、有限带宽等导致的变形;
  5. 底片感光图像显示时会造成记录显示失真
  6. 成像系统中存在的各种随机噪声。

机理是什么

典型的图像复原方法是根据图像退化的先验知识建立一个退化模型,以此模型为基础,采用滤波等手段进行处理,使得复原后的图像符合一定的准则,达到改善图像质量的目的。

2.图像复原和图像增强有哪些主要区别?

图像增强是一种改进图像视觉效果的技术,是为了突出图像中感兴趣的特征,增强后的图像可能与原始图像存在一定的差异。

图像复原是一种对退化(或品质下降)的图像去除退化因素,进而复原或重建被退化图像的技术,是针对图像退化的原因做出补偿,使恢复后的图像尽可能接近原始图像。

3.图像复原的关键任务是什么?

建立退化模型

4.什么是无约束复原﹖其基本原理是什么?存在什么问题?

根据系统退化模型,噪声项可以表示为

n=gHfn = g-H \cdot f

在噪声n不确定的情况下,希望对原始图像f的估计值f^\hat{f}应该满足这样的条件,希望找到一个f^\hat{f},使得

n2=gHf^2=(gHf^)T(gHf^)\|n\|^{2}=\|g-H \hat{f}\|^{2}=(g-H \hat{f})^{T}(g-H \hat{f})

为最小(噪声项的范数最小)。由定义可知

n2=nTn\|n\|^{2}=n^{T} n

n2||n||^2最小等效于求gHf^2||g-H\hat{f}||^2最小,即J(f^)=gHf^2J(\hat{f}) = ||g-H\hat{f}||^2的极小值问题。

这里的选择除了要求为最小外,不受任何其他条件的约束,因此称为无约束复原

由于g=Hf+ng = Hf+n可知,在不考虑图像噪声的情况下,要恢复元图像需要对矩阵H求逆,即:f=H1gf = H^{-1}g

在实际中可能有逆矩阵H1H^{-1}不存在的情况,但却确实存在着与ff十分近似的解。这称为恢复问题的奇异性

5.什么是逆滤波复原﹖其病态条件是什么?如何避免?

逆滤波复原:是通过变换到频域进行滤波复原的方法,属于频域图像复原方法。

条件:由于H(u,v)H(u,v)在分母上,当u-v平面上有些点或区域H(u,v)H(u,v)很小或等于零,即出现了零点时,就会导致不稳定解。

避免方法:在H(u,v)=0H(u,v)=0的那些频谱点及其附近,人为地设置H1(u,v)H^{-1}(u,v)的值,使得在这些频谱点附近N(u,v)/H(u,v)N(u,v)/H(u,v)不会对(u,v)(u,v)产生太大的影响。

6.什么是有约束复原?什么情况下使用?

在了解关于退化系统的传递函数的基础上,还知道了某些噪声的统计特性或噪声与图像的某些相关情况的情况下使用

约束复原:根据所了解的噪声的先验知识的不同,采用不同的约束调节,可得到不同的图像复原技术。

7.维纳滤波的准则是什么?其有效性受哪些因素影响?

准则:将原始图像ff和对原始图像的估计f^\hat{f}看作随机变量,按照ff和估计值f^\hat{f}之间的均方误差达到最小的准则实现图像复原。

因素

(1)当图像复原的目的是供人观察时,均方误差(MSE)准则并不是一个特别好的优化准则。这是因为MSE准则不管其在图像中的位置对所有误差都赋以同样的权﹐而人眼则对暗处和高梯度区域的误差比其他区域的误差具有较大的容忍性。由于使均方误差最小化,维纳滤波器以一种并非最适合人眼的方式对图像进行了平滑。
(2)经典的维纳去卷积不能处理具有空间可变点扩散函数的情形﹐例如存在彗差﹑散差﹑表面像场弯曲以及含旋转的运动模糊等情况。
(3)这种技术不能处理非平稳信号和噪声的一般情形。许多图像都是高度非平稳的,有着被陡峭边缘分开的大块平坦区域。此外,一些重要的噪声源具有与局部灰度有关的特性。

8. 中值滤波可以用于哪种原因的图像退化复原?二维中值滤波窗口有哪几种?各适用于什么场合?

可以克服线性滤波如最小均方滤波,均值滤波给图像边缘带来的模糊,可以既取出噪声,又能保护图像的边缘,从而获得比较满意的图像复原效果。

常用的有5种,方形,圆形,十字形

image-20220430224147593

对于有缓变的较长轮廓线物体的图像,采用方形或圆形为宜

对于包含尖顶角物体的图像,事宜用十字形窗口。

窗口大小则以不超过图像中最小有效物体的尺寸为宜。

第十章:图像分割与边缘检测(重点)

1、数字图像处理的三个层次

image-20220430224519535

什么是SHIFT特征

具有尺度,旋转,平移,不变性的特征

2、什么是图像分割﹖有哪些主要方法?

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。

主要方法:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法、基于特定理论的分割方法等。

3、灰度阈值分割的基本原理。如何找到双峰直方图的分割阈值。

原理:把图像灰度分成不同的等级,然后用设置灰度门限(阈值)的方法,确定有意义的区域或分割物体的边界。

图像中的目标分布在较暗的灰度级上形成一个波峰,图像中的背景分布在较亮的灰度级上形成另一个波峰。以双峰之间的谷低处灰度值作为阈值T进行图像的阈值化处理,便可将目标和背景分割开来。

4、区域分割方法主要有哪两种﹖实现过程步骤、各有什么特点?

  1. 区域生长法

    思想:将每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围领域中与种子像素有相同或相似的像素合并到种子像素所在的区域中。

  2. 分裂合并法

    分裂合并法先从整幅图开始,先将图像分成任意大小且不重叠的区域,然后再合并或分裂这些区域以满足分割的要求。

5、什么是图像的边缘﹖常见的边缘信号有哪些?

图像的边缘是指其周围像素灰度有阶跃变化或屋顶变化的像素的集合。

边缘信号

  1. 阶跃信号
  2. 斜坡信号
  3. 屋顶信号

image-20220501143145925

6、基于梯度的边缘检测算子有哪些﹖各有什么特点?

  1. 罗伯特算子(Robert)利用局部差分方法寻找边缘,其梯度算子采用的是对角方向相邻两像素值之差。

    算子模板:

    [[1 0] [[ 0 1]

    [0 -1]] [-1 0]]

  2. 索贝尔算子(Sobel)具有一定的噪声抑制能力,在检测阶跃边缘是可以得到至少两个像素的边缘宽度。

    算子模板:

    [[-1 -2 -1] [[-1 0 1]

    [0 0 0] [-2 0 2]

    [1 2 1]] [-1 0 1]]

  3. 普瑞维特算子(Prewitt) 利用局部差分平均法寻找边缘的算子

    算子模板:

    [[-1 -1 -1] [[1 0 -1]

    [0 0 0] [1 0 -1]

    [1 1 1]] [1 0 -1]]

  4. 拉普拉斯算子(Laplancian) 二阶导数算子,噪声成分得到加强,对噪声更敏感

    算子模板:

    [[ 0 -1 0] [[-1 -1 -1]

    [-1 4 -1] [-1 8 -1]

    [0 -1 0]] [-1 -1 -1]]

  5. 凯西算子(Kirsch):8组算子(对应8个方向),取最大值(确定方向)

    算子模板:

    image-20220501144802750

  6. Marr算子(LOG算子),抗噪声能力强,各向同性,图像模糊化

  7. Canny算子,2D高斯模板平滑滤波(平滑图像,去噪),求梯度(幅度与方向),非极大抑制(每个像素与其梯度方向相邻像素(两个)比较,如其灰度非极大值,则该点置0),双阈值判别(根据灰度直方图计算两个阈值)

各边缘算子的特点

image-20220501145122310

7、常用的二阶梯度算子有哪些﹖有何特点﹖

Laplancian,Marr,Canny,特点如上图

8、进行边缘检测前,应该对图像进行什么处理?

需要进行图像平滑,去除噪声

9、什么是图像匹配﹖主要有哪些方法?

图像匹配,就是指将不同时间、不同成像条件下对同一物体或场景获取的两幅或多幅图像在空间上对准,或根据已知模式到另一幅图像中寻找相应的模式。

方法:

  1. 模板匹配
  2. 直方图匹配
  3. 形状匹配

10、模板匹配的原理是什么?有何局限?

模板匹配是指用一个较小的图像即模板,与源图像进行比较,以确定在源图像中是否存在与该模板相同或相似的区域,若该区域存在,还可确定其位置并提取该区域。

模板匹配的主要局限性在于它只能进行平行移动,如原图像中要匹配的目标发生旋转或大小变化,该算法无效。如原图像中要匹配的目标只有部分可见,该算法也无法完成匹配。

11、直方图匹配和形状匹配的原理是什么?

要利用图像的颜色特征描述图像,可借助图像特征的统计直方图。利用直方图进行图像的匹配,这便是直方图匹配

形状匹配:目标的形状常常可以用目标的轮廓来表示,而轮廓是由一系列边界点所组成的。一般认为,在较大尺度下常常能较可靠地消除误检并检测到真正的边界点,但在大尺度下对边界的定位不易准确。相反,在较小尺度下对真正边界点的定位常比较准确,但在小尺度下误检的比例会增加。所以,可考虑先在较大尺度下检测出真正的边界点,再在较小尺度下对真正边界点进行较精确的定位。

第十一章:图像特征与理解

1、图像特征是指什么﹖具有什么作用?

图像特征是区分一个图像内部或区域的最基本属性和特点。

可以用于图像识别,分类和理解。

2、SIFT特征具有什么特点﹖其实际应用价值是什么?

对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

可以帮助不同视角的图像,实现物体对齐

可以用于

2、SIFT特征具有什么特点﹖其实际应用价值是什么?

特点:对旋转,尺度缩放,亮度变化保持不变性,对视角变换,仿射变化,噪声也保持一定程度的稳定性

可以实现不同视角的图像物体实现对齐

3、提取图像特征之前,需要对图像进行什么处理?

图像去噪,图像增强,图像恢复

4、数字图像中如何计算区域的周长?

  1. 若把图像中的像素视为单位面积的小方块,那么区域和背景之间的间隙(隙码)数量就是区域的周长(如下图红色部分)

    image-20220501152417888

  2. 若把图像中的像素视为点,水平垂直边为1,斜边为2\sqrt{2},这个叫做他的链码(如下图)

    image-20220501153322918

  3. 用边界所占面积表示

    image-20220501153711342

5、数字图像处理中,计算区域的面积有哪些方法?

  1. 像素计数法,物体边界内像素点的总和
  2. 边界行程码计算法
  3. 边界坐标计算法

6、什么是物体的形状特征﹖常见的有哪些﹖

矩形度,宽长比,圆形度,球状度,不变矩,偏心率。

7、为什么说不变矩是具有平移、旋转、尺度不变性的特征?不变矩的阶数是如何确定的?

相对于主轴计算采用面积归一化的中心矩,在物体放大,平移,旋转时保持不变。利用归一化的中心矩,可以获得不变矩的多种组合,这些组合对于平移,旋转,尺度等变换都具有不变性。将x,y的指数进行相加,就可以得到图像矩的阶数。

8、拓扑描述具有什么特点﹖欧拉数如何计算﹖

图形的拓扑性质具有稳定性,即只要图形没有发生破坏性变化,其拓扑性质就不会因为物理变化而改变。

连接部分表示连通区域,孔洞数表示连接区域中的空白圈

欧拉数=区域内的连接部分区域中的孔洞数欧拉数 = 区域内的连接部分 - 区域中的孔洞数

例题1

image-20220501160040738

其中,对a的话,就是小于127的像素全部变为0,大于等于127的像素全部变为255

对b的话,是一个分段函数,0~100的像素为50,100~180的像素x按照函数

g(x)=x100180100×(25550)+50=x10016×41+50g(x) = \frac{x-100}{180-100}\times(255-50)+50 = \frac{x-100}{16}\times 41+50

计算,对于180~255的像素为255

例题2

image-20220501160528066

高通:有正有负,低通:只有正

边缘检测,中间为0,0在行表示水平检测,在列表示竖直检测,在对角线表示45度角检测

中间向四周称高斯分布且为低通,则表示图像平滑,去噪

没有0,但是是高通就是锐化

例题3

image-20220501161450669

image-20220501162636393

例题4

image-20220501162714562

例题5

image-20220501162855247

image-20220501162918281

最邻近就是,计算两点之间距离,距离最小的那个就是像素值

例题6

image-20220501163727755

变亮向上,变暗向下

例题7

image-20220501164135932

例题8

image-20220501164333451

例题9

image-20220501164502182