本书以图像视频处理的基本原理为主线,以实际应用为扩展,以前沿技术动态为补充,介绍图像视频处理领域的研究热点及关键技术。全书共11 章,分为四部分。第一部分包括第1~3 章,主要介绍图像视频处理的基本概念与理论。第二部分包括第4~8 章,主要介绍图像处理的关键技术及其实际应用。第三部分包括第9、10 章,主要介绍视频处理的关键技术及其实际应用。第四部分为第11 章,主要介绍多模态信息处理技术。
样章试读
目录
- 目录
前言
第1章 绪论 1
1.1 引言 1
1.2基本概念 2
1.2.1图像的基本概念 2
1.2.2视频的基本概念 5
1.3数字图像视频处理技术的应用 6
1.3.1在智能交通领域的应用 6
1.3.2在公共安全领域的应用 8
1.3.3在教育领域的应用 9
1.3.4在医疗领域的应用 10
1.3.5在航空航天领域的应用 11
1.4本书的内容及特色 12
思考题 12
参考文献 12
第2章 图像常用变换 14
2.1可分离变换和正交图像变换 14
2.2傅里叶变换 16
2.2.1一维和二维傅里叶变换 16
2.2.2傅里叶变换定理 19
2.3离散余弦变换 24
2.3.1一维离散余弦变换 24
2.3.2二维离散余弦变换 27
2.4小波变换 28
2.4.1小波变换基础 29
2.4.2一维小波变换 34
2.4.3快速小波变换 35
2.4.4二维小波变换 37
思考题 40
参考文献 40
第3章 深度学习 42
3.1 引言 42
3.1.1基本概念 42
3.1.2反向传播 44
3.1.3优化学习 46
3.1.4深度学习发展史简介 50
3.2深度学习技术 53
3.2.1卷积神经网络的基本原理 53
3.2.2池化层与全连接层 59
3.2.3 CNN示例计算 61
3.2.4常见的卷积神经网络 62
3.2.5 GAN 80
3.2.6 Transformer 82
3.3深度学习技术在图像处理领域的应用 91
思考题 94
参考文献 94
第4章 图像增强处理 96
4.1 引言 96
4.1.1图像增强处理的目的和意义 97
4.1.2图像增强处理的常用方法 97
4.2直方图均衡类图像增强处理方法 99
4.2.1图像直方图的基本原理 99
4.2.2基于直方图均衡化的图像增强处理方法 100
4.3 Retinex类图像增强处理方法 106
4.3.1 Retinex基本原理 106
4.3.2 基于 Retinex理论的图像增强处理方法 107
4.4研究进展及实际应用 111
4.4.1前沿技术动态简介 111
4.4.2实际应用示例 114
思考题 117
参考文献 117
第5章 图像水印技术 120
5.1数字图像水印的概念、分类及应用 120
5.1.1数字图像水印的概念 120
5.1.2数字图像水印的分类 121
5.1.3数字图像水印的应用 123
5.2常见数字图像水印攻击及性能评价 125
5.3传统数字图像水印算法 129
5.3.1数字图像水印算法的一般模型 129
5.3.2数字图像单水印算法 130
5.4数字图像双水印技术 137
5.5深度学习在数字图像水印领域的应用 140
思考题 142
参考文献 143
第6章 图像检索 144
6.1 引言 144
6.1.1图像检索研究背景 144
6.1.2图像检索研究意义 145
6.1.3 图像检索存在的问题 146
6.2图像底层特征提取 148
6.3中层语义特征提取 153
6.3.1词袋特征 153
6.3.2潜在语义特征 154
6.3.3稀疏编码特征 155
6.4图像检索性能评价 156
6.4.1查全率和查准率 156
6.4.2 F得分 157
6.4.3 ROC曲线和 AUC 157
6.5应用实例 158
思考题 159
参考文献 159
第7章 高光谱图像处理 161
7.1 引言 161
7.1.1基本概念 161
7.1.2高光谱图像的获取原理 162
7.2高光谱图像处理方法分类 164
7.2.1高光谱图像解混 165
7.2.2高光谱图像分类 167
7.2.3高光谱图像异常目标检测 169
7.3高光谱图像解混应用示例 172
vi 数字图像视频处理及应用
7.3.1基于非负矩阵分解的解混算法 172
7.3.2 MVC-NMF算法 174
7.3.3 GNMF算法 175
7.3.4 GLNMF算法 176
7.3.5 EAGLNMF算法 177
7.4高光谱图像异常目标检测应用示例 189
7.4.1基于统计的线性异常目标检测算法 189
7.4.2非线性异常目标检测算法 189
7.4.3 GFM 192
思考题 198
参考文献 198
第8章 高动态范围图像处理 202
8.1 引言 202
8.1.1高动态范围概念 203
8.1.2高动态范围图像相关理论 204
8.1.3高动态范围图像获取概述 206
8.2多曝光图像生成 HDR图像方法 208
8.2.1空间域生成 HDR图像 211
8.2.2变换域生成 HDR图像 215
8.2.3基于深度学习的多曝光图像生成 HDR图像 219
8.3单曝光图像生成 HDR图像方法 221
8.3.1传统算法 221
8.3.2基于深度学习的单曝光图像生成 HDR图像 225
8.4高动态范围图像色调映射 228
8.4.1色调映射基础 228
8.4.2经典色调映射算法 230
思考题 235
参考文献 235
第9章 视频编码与码率控制 238
9.1视频编码 238
9.1.1基本原理 238
9.1.2视频编码标准发展历程 241
9.1.3视频编码与码率控制的关系 242
9.2码率控制的目的 242
9.3码率控制技术原理与发展 243
9.3.1基本原理 243
9.3.2发展历程 244
9.4先进的基于 λ域的码率控制技术 246
9.4.1 初始 QP选择 246
9.4.2目标比特分配 247
9.4.3目标比特实现 253
9.4.4参数更新 254
9.5应用示例 254
9.5.1示例目的 254
9.5.2示例内容 254
思考题 257
参考文献 257
第10章 视频目标检测与跟踪 260
10.1视频目标检测 260
10.1.1基本概念 260
10.1.2基本方法原理 261
10.2视频目标跟踪 270
10.2.1基本概念 270
10.2.2基本方法原理 272
10.3研究进展及实际应用 286
10.3.1目标检测前沿技术及其应用 286
10.3.2目标跟踪前沿技术及其应用 290
思考题 292
参考文献 292
第11章 多模态信息处理 295
11.1图像特征表达 295
11.1.1图像特征 295
11.1.2基于统计学习的图像特征提取方法 298
11.1.3基于深度学习的图像特征提取方法 300
11.2语音特征表达 302
11.2.1语音特征 302
11.2.2基于统计学习的语音特征提取方法 304
11.2.3基于深度学习的语音特征提取方法 307
11.3文本特征表达 308
11.3.1文本特征 308
11.3.2基于深度学习的文本特征提取方法 312
11.4跨模态检索 312
11.5多模态联合决策 315
思考题 315
参考文献 316