这是图像处理领域一本令人激动的书籍。作者从变分法、偏微分方程、小波方法及随机方法的框架下对图像处理和分析进行了深入浅出的描述和分析。
本书首先介绍了对于现代图像分析和处理有重要意义的一般数学、物理和统计背景,包括曲线和曲面的微分几何、有界变差函数空间、统计力学的要素及其在图像分析中的含义、贝叶斯估计理论一般框架、滤波和扩散的紧理论以及小波理论的要素;同时讨论了图像建模和表示的方法,包括各种确定型的图像模型、随机的Gibbs图像模型以及自由边界分割模型。本书讨论四种最常见的图像处理任务如图像降噪、图像去模糊、图像修复或插值以及图像分割的建模和计算,这些实际的图像处理任务在统一的数学框架下能够得到完整的分析和深入的理解。
本书可供图像处理领域的科研工作者、在图像处理领域有一定接触但缺乏数学基础的学生或者有数学训练但是未接触过图像科学的学生、对图像处理有兴趣的一般数学工作者以及对图像处理有兴趣的一般研究人员阅读。
样章试读
目录
- 目录
原书前言
第1章 介绍
1.1 图像科学时代的曙光
1.1.1 图像采集
1.1.2 图像处理
1.1.3 图像判读和视觉智能
1.2 图像处理的例子
1.2.1 图像对比度增强
1.2.2 图像降噪
1.2.3 图像去模糊
1.2.4 图像修复
1.2.5 图像分割
1.3 图像处理方法论的综述
1.3.1 形态学方法
1.3.2 Fourier分析和谱分析
1.3.3 小波和空间-尺度分析
1.3.4 随机建模
1.3.5 变分方法
1.3.6 偏微分方程(PDEs)
1.3.7 不同的方法是本质互通的
1.4 本书的编排
1.5 如何阅读本书
第2章 现代图像分析工具
2.1 曲线和曲面的几何
2.1.1 曲线的几何
2.1.2 三维空间中的曲面几何
2.1.3 Hausdorff测度与维数
2.2 有界变差函数
2.2.1 作为Radon测度的全变差
2.2.2 有界变差函数的基本性质
2.2.3 co-area公式
2.3 热力学和统计力学要素
2.3.1 热力学要素
2.3.2 熵和势
2.3.3 系综的统计力学
2.4 贝叶斯统计推断
2.4.1 作为推断图像处理或视觉感知
2.4.2 贝叶斯推断:由于先验知识的偏差
2.4.3 图像处理中的贝叶斯方法
2.5 线性和非线性滤波和扩散
2.5.1 点扩展和马尔可夫转移
2.5.2 线性滤波和扩散
2.5.3 非线性滤波和扩散
2.6 小波和多分辨率分析
2.6.1 关于新图像分析工具的探索
2.6.2 早期的边理论和Marr小波
2.6.3 加窗频率分析和Gabor小波
2.6.4 频率-窗口耦合: Malvar-Wilson小波
2.6.5 多分辨分析框架(MRA)
2.6.6 通过滤波组进行快速图像分析和合成
第3章 图像建模和表示
3.1 建模和表示:是什么,为什么和怎么做
3.2 确定性图像模型
3.2.1 作为分布的图像(广义函数)
3.2.2 L^p图像
3.2.3 Sobolev图像H^n(Ω)
3.2.4 BV图像
3.3 小波和多尺度表示
3.3.1 二维小波的构造
3.3.2 对典型图像特征的小波响应
3.3.3 Besov图像和稀疏小波表示
3.4 格子和随机场表示
3.4.1 大自然中的自然图像
3.4.2 作为系综和分布的图像
3.4.3 作为Gibbs系综的图像
3.4.4 作为马尔可夫随机场的图像
3.4.5 视觉滤波器和滤波器组
3.4.6 基于熵的图像模式学习
3.5 水平集表示
3.5.1 经典水平集
3.5.2 累积水平集
3.5.3 水平集合成
3.5.4 一个例子:分片常图像的水平集
3.5.5 水平集的高阶正则性
3.5.6 自然图像水平集的统计
3.6 Mumford-Shah自由边界图像模型
3.6.1 分片常数一维图像:分析和合成
3.6.2 分片光滑一维图像:一阶表示
3.6.3 分片光滑一维图像:泊松表示
3.6.4 分片光滑二维图像
3.6.5 Mumford-Shah模型
3.6.6 特殊BV图像的作用
第4章 图像降噪
4.1 噪声:来源,物理和模型
4.1.1 噪声的来源和物理
4.1.2 一维随机信号的简短概述
4.1.3 噪声的随机场模型
4.1.4 作为随机广义函数的模拟白噪声
4.1.5 来源于随机微分方程的随机信号
4.1.6 二维随机空间信号:随机场
4.2 线性降噪:低通滤波
4.2.1 信号对噪声
4.2.2 通过线性滤波器和扩散来降噪
4.3 数据驱动的最优滤波:维纳滤波器
4.4 小波收缩降噪
4.4.1 收缩:单子的拟统计估计
4.4.2 收缩:单子的变分估计
4.4.3 通过收缩带噪小波成分降噪
4.4.4 带噪Besov图像的变分降噪
4.5 基于BV图像模型的变分小波降噪
4.5.1 TV,稳健统计和中值
4.5.2 TV和BV图像模型的作用
4.5.3 带偏迭代中值滤波
4.5.4 Rudin,Osher和Fatemi的TV降噪模型
4.5.5 TV降噪的计算途径
4.5.6 TV降噪模型的对偶
4.5.7 TV降噪模型的解结构
4.6 通过非线性扩散和尺度-空间理论降噪
4.6.1 Perona和Malik的非线性扩散模型
4.6.2 公理化尺度-空间理论
4.7 椒盐噪声降噪
4.8 多通道TV降噪
4.8.1 多通道图像的变分TV降噪
4.8.2 TV[u]的三个版本
第5章 图像去模糊
5.1 去模糊:物理来源及数学模型
5.1.1 物理来源
5.1.2 模糊的数学模型
5.1.3 线性模糊对非线性模糊
5.2 不适定性与正则化
5.3 用维纳滤波器去模糊
5.3.1 滤波器去模糊的直观解释
5.3.2 维纳滤波
5.4 用已知的PSF函数对BV图像去模糊
5.4.1 变分模型
5.4.2 存在性和唯一性
5.4.3 计算
5.5 用未知的PSF进行变分盲去模糊
5.5.1 参数化盲去模糊
5.5.2 基于参数-场的盲去模糊
5.5.3 无参数盲去模糊
第6章 图像修复
6.1 关于经典插值格式的简要回顾
6.1.1 多项式插值
6.1.2 三角多项式插值
6.1.3 样条插值
6.1.4 香农采样定理
6.1.5 径向基函数和薄板样条
6.2 二维图像修复的挑战和指南
6.2.1 图像修复主要的挑战
6.2.2 图像修复的一般指南
6.3 Sobolev图像的修复:Green公式
6.4 曲线和图像的几何建模
6.4.1 几何曲线模型
6.4.2 2点和3点累积能量、长度和曲率
6.4.3 通过泛函化曲线模型得到的图像模型
6.4.4 带嵌入边模型的图像模型
6.5 BV图像修复(通过TV Radon测度)
6.5.1 TV修复模型的格式
6.5.2 通过视觉感知进行TV图像修复的纠正
6.5.3 TV图像修复的计算
6.5.4 基于TV修复的数码变焦
6.5.5 通过修复得到的基于边的图像编码
6.5.6 TV修复的更多的例子和应用
6.6 图像修复的误差分析
6.7 通过Mumford和Shah模型修复分片光滑图像
6.8 通过Euler弹性和曲率模型修复图像
6.8.1 基于弹性图像模型的修复
6.8.2 通过Mumford-Shah-Euler图像模型的修复
6.9 Meyer纹理的修复
6.10 用缺失小波系数进行图像修复
6.11 PDE修复:输运,扩散和Navier-Stokes
6.11.1 二阶插值模型
6.11.2 一个三阶PDE修复模型和Navier-Stokes
6.11.3 TV修复的修订:各向异性扩散
6.11.4 CDD修复:曲率驱动的扩散
6.11.5 三阶修复的一个拟公理化方法
6.12 Gibbs/Markov随机场的修复
第7章 图像分割
7.1 合成图像:遮挡原像构成的幺半群
7.1.1 介绍和动机
7.1.2 遮挡原像构成的幺半群
7.1.3 最小及素(或原子)生成子
7.2 边和活动轮廓
7.2.1 边的逐像素表征:David Marr的边
7.2.2 图像灰度值的边调整数据模型
7.2.3 边的几何调整先验模型
7.2.4 活动轮廓:组合先验模型和数据模型
7.2.5 通过梯度下降法得到的曲线演化
7.2.6 活动轮廓的Г收敛性逼近
7.2.7 由梯度驱动的基于区域的活动轮廓
7.2.8 由随机特征驱使的基于区域的活动轮廓
7.3 S.Geman和O.Geman的强度-边混合模型
7.3.1 拓扑像素域,图和基团
7.3.2 作为隐马尔可夫随机场的边
7.3.3 作为边调整马尔可夫随机场的光强
7.3.4 关于u 和Г的联合贝叶斯估计的Gibbs场
7.4 Mumford-Shah的自由边界分割模型
7.4.1 Mumford-Shah分割模型
7.4.2 渐近M.-S.模型Ⅰ:Sobolev光滑
7.4.3 渐近M.-S.模型Ⅱ:分片常值
7.4.4 渐近M.-S.模型Ⅲ:测地线活动轮廓
7.4.5 M.-S.分割的非唯一性:一个一维例子
7.4.6 M.-S.分割的存在性
7.4.7 如何分割Sierpinski岛
7.4.8 M.-S.分割的隐藏对称性
7.4.9 计算方法Ⅰ:Г收敛性逼近
7.4.10 计算方法Ⅱ:水平集方法
7.5 多通道逻辑分割
参考文献
索引
致谢
插图目录
图1.1 一幅理想的图像:无噪声,完整并且有好的对比度
图1.2 一幅理想图像的低对比度版本
图1.3 加性高斯噪声降质(第4章)
图1.4 带10%空间密度的椒盐噪声(第4章)
图1.5 离焦模糊造成的降质:数码相机聚焦于1英寸外的指尖,而目标场景为1英尺以外(第5章)
图1.6 单次曝光中,由于水平按快门抖动所造成的运动模糊导致图像降质(第5章)
图1.7 150个大小为8×8的数据包在传输过程中随机地损失(第6章).错误隐藏(或更一般地,修复)的目的是要开发能够自动填充这些空白的模型和算法
图1.8 对人类视觉来说,这样卡通化的分割似乎是简单的,但是在图像处理和低层计算机视觉(第7章)中仍然是一个最基本和挑战性的问题(背景分割Ω0没有在这里显式地表示出来)
图1.9 一个二值集合A和一个结构元素S(对于膨胀和腐蚀)
图1.10 膨胀D_S(A)(左)和腐蚀E_S(A)(右):膨胀关闭小的洞或沟,而腐蚀则将它们打开
图1.11 一幅数字图像和它的离散Fourier变换.这个例子显示了Fourier图像分析的几个突出的特点:①大多数高振幅系数集中于低频带;②在原始图像中主导的方向性信息可以容易地在Fourier域中被识别;③但是对于Heaviside型方向性边,系数衰减得很慢(即沿着它的两个肩有不同常数值的跳跃线)
图1.12 一个采用Daubechies的设计的(母)小波的例子.局部性和振荡是所有小波的特性
图1.13 一个一维带噪信号和它的通过(1.7)的最优化恢复
图1.14 在平均曲率运动(1.11)或(1.12)下的三叶演化
图1.15 不同的方法是本质互通的:一个例子
图1.16 本书的编排
图2.1 平面曲线:切向量t,法向量n和曲率κ
图2.2 二阶局部几何:曲面法向量N和两个垂直的主曲率圆
图2.3 一个曲面片z=h(u;v)=cos(u)cos(v)(上),它的平均曲率域H(左下),高斯曲率域K(右下)
图2.4 一个集合E(左)和它的覆盖A(右),像带阴影的大方格(右)那样来覆盖元素没有忠实地抓住小尺度的细节,Hausdorff测度定义使得覆盖标量趋向于0
图2.5 一个集合E的Hausdorff维数dim_H(E)是关键的d,在图中大于d,E就显得太“瘦”,而小于d就显得太“胖”
图2.6 三个一维图像,TV[f]=TV[g]=TV[h]=2
图2.7 一个L^1下半连续性的例子.区间[0,1]上的一维图像序列(u_n)在L^1中收敛到u=0,因为‖u_n+1-u‖_L^1≤2^-n,注意到TV(u)=0,然而TV(u_n)≡2,这和下半连续性是一致的:TV(u)6≤liminf TV(u_n)
图2.8 TV的几何意义:co-area公式.对于光滑的图像来说,TV[u]是所有水平曲线长度的和,权重是Lebesgue微元dλ.这幅图是一个离散的近似:TV[u]*∑length(u≡λ_n)△λ
图2.9 Gibbs正则系综:较高的温度与较小的β和更一致的分布相关联;另一方面,当T*0,系统会仅仅保持基态(在物理上会导致超流和超导)
图2.10 两个理想化的4状态系统的Gibbs熵(κ被设置成1).熵通常定义了一个系统的自由度,因此,较低的熵就意味着系统被更多地限制(这个结论使得香农定义了一个作为信息矩阵的负熵,因为较小的随机性就意味着更多的信息)
图2.11 一个由(2.38)定义的线性各向异性扩散的例子,对角扩散矩阵D=diag(D_x;D_y)且D _y:D_x=10:1,因此,在垂直的y方向上图像扩散得比较快
图2.12 理想的一维信号(x_n)中有5个部分的片段的中位数
图2.13 一个使用中值滤波器的例子(用7×7的正方体窗口),给被严重的椒盐噪声污染的图像去噪.注意到中值滤波的杰出性质:被恢复后的图像的边界没有抖动
图2.14 像(2.50)中那样定义的Marr小波的两个例子(墨西哥帽)
图2.15 一种通过对称地构造它的平方w^2(x)来设计窗口模板ω(x)的通用方法
图2.16 作为(Hilbert)空间分解的MRA:更精细的分辨空间V_2被分解为细节(或小波)空间W_1和更粗糙的分辨空间V_1.同样的过程应用于V_1和其他所有的V_j
图2.17 用Daubechies设计的一对紧支的尺度函数φ(x)和母小波ψ(x)
图2.18 通过滤波器组的快速小波变换:双通道分析(或分解)和合成(或重构)组
图3.1 作为分布或广义函数的图像.测试函数对各种生物或数字传感器进行建模,如人类视觉中的视网膜感光细胞或者CCD相机中的耦合装置
图3.2 二维中三个通过张量积构造的Haar母小波函数
图3.3 B^α_q(L^p)中的Besov范数度量空间尺度平面信号的强弱:L^p是内层变量,L^q是内部或者环绕尺度变量(以dλ=dh/h表示),h^-α是Hölder连续性的对照
图3.4 马尔可夫随机场的组成部分的例子:一个邻域N_α(左),两个双子基团C∈C(中),条件推断的局部性p(u_α|u_Ω\_α)=p(u_α|u_N_α)(右)
图3.5 △λ=h;λ=nh的分支L_λ,△λ的例子,L_3h,h分支有两个小叶
图3.6 一个(有紧支集)的分片光滑信号u的(x_n;b_n;g_n)表示.在光滑区域信号u变化很慢,g_n总是小的,编码它们只需要供应一些比特
图3.7 一个分片光滑信号u的泊松表示.在这里,只展示一个单独表示区间.信号u被两个边界值u^+_n和u^-_ n+1所表示,并且其二阶导数f=u'(对应于电磁学中的源分布).在区间上重构u相当于求解泊松方程(3.62).这种表示的优点是对于光滑信号,f通常是小的(就像小波系数),并且与u相比需要更少的比特位
图4.1 一个二维布朗运动的轨迹样本W(t)(0图4.2 一个以X(0)=1为初值的随机微分方程dX=2Xdt+XdW产生的随机信号样本.图中光滑的破折号曲线是期望曲线x(t)=EX(t)=e^2t.因为X(t)的期望与方差都在演变,与这个随机信号显然是非平稳的
图4.3 硬阈值T_λ(t)与软收缩S_λ(t)
图4.4 收缩算子a_*=S_σ(a_0)在所有满足一致收缩条件(4.25)的估计子a中达到了最小收缩(定理4.4)
图4.5 两个以λ=μ=1和a_0=1,2的单子误差函数e_1(t|a_0).注意到最优估计子(即谷值)a=0,1正是σ=μ/λ=1的收缩S_σ(a_0)
图4.6 一个带高斯白噪声水平σ=0.1并有4个基于Daubechies的单位正交小波的小波分解水平.下面的三幅图表明了阈值参数λ在收缩算子S_λ中的作用:一个过大的?引起过收缩和过平滑,而太小的λ则导致相反的结果
图4.7 与图4.6同样的例子,但高斯噪声水平为σ=0.2
图4.8 用移动均值去噪和用移动中值去噪的效果比较.在每条边两方都使用了同样对称(移动的)四邻域窗口.和预期一样,中值滤波器对清晰边的保留优于均值滤波器(破折号曲线表示理想的无噪信号)
图4.9 Rudin,Osher和Fatemi的TV降噪的一个例子
图4.10 一个目标像素O与其邻点
图4.11 一个对带噪图像应用Perona和Malik的各向异性扩散的例子.在例子中使用的非线性系数D(|▽u|)是(4.93)和(4.94)中的.注意与线性热扩散中在去除噪声时总会模糊掉锐边不同,其显著的边保留特征
图4.12 两个椒盐噪声和中值滤波去噪表现的例子.与理论分析一样,中值滤波对低空间密度非常有效,而在高空间密度时表现较差
图4.13 一个应用TV修补技术(4.103)(见Chan和Shen^[67]或第6章)于高密度椒盐噪声降噪的例子
图5.1 由于快门抖动造成运动模糊的一个例子
图5.2 点源的运动模糊图像
图5.3 离焦模糊的一个例子
图5.4 离焦成像的几何光学图
图5.5 利用维纳滤波器去模糊和降噪的一个例子
图5.6 用已知的PSF函数对离焦图像去模糊
图5.7 对水平快门抖动的模糊图像去模糊
图5.8 恢复运动模糊图像的另一个例子
图5.9 双BV盲去模糊的一个计算实例(Chan和Wong)
图6.1 修复的目的是为了基于在缺失(或修复)区域D之外得到的不完整或者降质的数据u^0在整个区域上重建理想图像u
图6.2 局部和全局模式识别在图像修复中的效应:在左边的面板上黑色似乎是合理的修复解,但对于右边的象棋盘模式,白色似乎更可信(Chan和Shen)
图6.3 图像修复中纵横比的效应
图6.4 光滑图像的调和修复(u=r=*x^2+y^2)和一个理想的阶跃边缘
图6.5 TV修复模型能够解释Kanizsa's Entangled Man吗?
图6.6 Kanizsa's Entangled Man模型
图6.7 修复含噪声的边缘
图6.8 修复遮挡带
图6.9 修复含噪声的面部
图6.10 修复去除文本
图6.11 数字调和放大和TV放大(Chan和Shen)
图6.12 通过TV修复的边解码(Chan和Shen);参见Guo,Zhu和Wu的模式-理论方法
图6.13 修复区域的纵横比影响修复格式的效果(Chan和Kang)
图6.14 基于Γ收敛理论的修复(6.42)和相应的椭圆系统(6.47)
图6.15 基于Mumford-Shah图像模型的修复去除文本
图6.16 两个同TV修复相对照的弹性修复的例子.当长宽比较大时,TV修复模型无法实现关联性原则
图6.17 基于Mumford-Shah-Euler图像模型的修图可以很好地按照期望修复光滑边
图6.18 一个用模型(6.64)修复带有缺失小波成分的含噪声且不完整的BV图像的例子(Chan,Shen和Zhou)
图6.19 另一个用模型(6.64)修复带有缺失小波成分的含噪声且不完整的BV图像的例子(Chan,Shen和Zhou)
图6.20 TV无法实现带有大尺度(或长宽比)的修复问题中的关联性原则
图6.21 CDD修复去除刮痕的例子(Chan和Shen)
图7.1 遮挡在视觉感知中的作用.左半部分:看到的究竟是白色背景上的灰色花瓶还是灰色背景上两张面对面的人脸?这就是缺少遮挡导致的典型错觉;右半部分(三叶型扭结):遮挡在绳结理论中的作用
图7.2 一个原像a_γ,b_δ以及它们的遮挡a_γ┤b_δ的例子.在现实生活中,复杂的图像总是由简单的物体通过遮挡得来的
图7.3 左边:一个圆盘原像;右边:一个平面原像
图7.4 在边界点x上(即γ(x)=1),根据(7.17),p=|▽u|(x)很大
图7.5 测地线活动轮廓模型的一个例子:给定的图像与轮廓通过(7.32)演化的三个不同阶段
图7.6 Chan和Vese的没有梯度的活动轮廓模型(7.52)(即基于区域且由期望场驱动的)的一个例子:脑截面图像(取自Chan和Vese)三个不同的演化阶段
图7.7 结合Chan和Vese的活动轮廓模型(7.52)以及Gabor滤波器(7.53)进行纹理分割的一个例子(显示随时间增长,参见文献[65,260])
图7.8 像素格Ω={a,b,…}以及边格E={α,β…}
图7.9 极大边基团上的6种二元边元构型及S.Geman和D.Geman给出的它们的经验势V^E_C(Γ)(其中A是一个常数)
图7.10 沿6种边元构型闭合回路的总曲率(在像素方阵内部)定性地与S.Geman和D.Geman在图7.9中经验选择的势相符
图7.11 例子的可视化效果:包含所有尺度水平的圆的集合S具有怪异的性质,即H^1(S)<∞,但H^1(S)=1,这是由于S=Ω
图7.12 左半部分:经典Sierpinski垫片(Mandelbrot^[206])的补集G由所有有阴影的开三角形(不包括它们的边)组成.右半部分:Sierpinski岛G(р)是G通过对其每一个三角形进行适当收缩得到的开集,收缩率由某一个р∈(0,3/2)(见文章)控制.而本节讨论的目标图像u _р是G(р)的示性函数
图7.13 基于Γ收敛的M.-S.分割模型的逼近(7.97)的一个例子:最优图像估计u=u_ε(x)以及与它相关的边\峡谷'函数z=z_ε(x).计算基于交错最小化格式(7.98)
图7.14 利用Chan和Vese提出的水平集算法计算M.-S.分割的一个例子
图7.15 一个由两个通道所合成的物体的实例.注意到A_1的左下角与A_2的上角都是缺失的
图7.16 样本图像不同的逻辑组合:并运算、交运算以及微分运算
图7.17 关于一幅医学图像的基于区域的逻辑模型.在第一个通道A_1中,噪声图像有一个“脑瘤”,而在通道A_2中却没有.目的就是标出这个存在于通道A_1却不存在于通道A_2的肿瘤,即进行微分运算A_1∩┐A_2.在右面一列中,发现肿瘤已经被成功地捕捉到了