在大数据时代背景与人工智能技术浪潮的推动下,基于视频图像处理的信息技术凭借其生动、形象、直观的特性,以及易于获取的优势,实现了广泛的应用。作为计算机视觉研究领域的核心分支,智能视觉信息处理技术研究内容涵盖图像处理、模式识别、机器学习和人工智能等多个学科,不仅具有显著的学术价值,而且展现出巨大的应用潜力。全书共六篇,介绍基于视频图像处理的人体行为轨迹估计与跟踪、2D人体姿态估计、3D人体姿态估计、舞蹈姿态估计与对比分析、汉字字体自动生成以及应用研究。本书中的模型和方法可以扩展至众多基于视觉信息处理技术的应用场景,以提供理论参考、方法借鉴和技术支撑。
样章试读
目录
- 目录
第一篇 人体行为轨迹估计与跟踪
第1章 基于多特征级联稀疏表示的目标跟踪方法 3
1.1 引言 3
1.2 基于粒子滤波框架的跟踪算法 5
1.2.1 粒子滤波算法 5
1.2.2 基于多特征融合的粒子滤波跟踪算法 6
1.3 基于多特征融合表示的外观模型 7
1.4 基于级联稀疏编码的目标表示 8
1.4.1 构造外观模型 8
1.4.2 第一级稀疏编码 9
1.4.3 第二级稀疏编码 10
1.5 状态更新 11
1.6 实验结果与性能分析 13
1.6.1 参数设置 14
1.6.2 定性比较 15
1.6.3 定量比较 18
1.7 本章小结 23
第2章 基于目标性度量学习的加权多示例跟踪方法 24
2.1 引言 24
2.2 基于目标性度量学习的加权多示例跟踪算法整体框架 25
2.3 目标性度量学习 26
2.4 基于目标性度量权重分配的包概率计算 28
2.5 分类器更新 30
2.6 在线目标匹配约束 31
2.7 基于其他指标的目标性度量 33
2.8 实验结果与性能分析 34
2.8.1 参数设置 34
2.8.2 定性比较 35
2.8.3 基于不同目标性度量指标的加权多示例跟踪算法对比实验 39
2.8.4 定量比较 40
2.9 本章小结 45
第3章 基于压缩感知尺度自适应的多示例交通目标跟踪方法 46
3.1 引言 46
3.2 基于压缩感知的多示例特征提取 48
3.3 低维压缩特征的多示例分类 49
3.4 基于目标性度量的尺度自适应调整 50
3.4.1 尺度自适应跟踪框选取 51
3.4.2 目标性度量 52
3.5 基于目标判别机制的分类器更新 52
3.6 实验结果与性能分析 55
3.6.1 参数设置 55
3.6.2 定性比较 56
3.6.3 定量分析 61
3.6.4 对比实验 63
3.7 本章小结 65
第4章 基于特征学习轨迹置信度计算的多人目标跟踪方法 67
4.1 引言 67
4.2 基于KCF学习轨迹置信度计算的多人目标跟踪算法 68
4.2.1 基于KCF的关联相似度计算 69
4.2.2 基于KCF的检测响应校正 72
4.2.3 基于KCF的遮挡分析 73
4.2.4 基于APCE轨迹置信度的两步数据关联 74
4.2.5 候选目标假设集的更新 75
4.3 实验结果与性能分析 76
4.3.1 多目标跟踪数据集 76
4.3.2 参数设置与评价指标 76
4.3.3 消融实验分析 77
4.3.4 与主流算法对比分析 79
4.4 本章小结 85
第二篇 2D 人体姿态估计
第5章 基于多尺度特征学习的多人姿态估计 89
5.1 引言 89
5.2 基于多尺度特征学习的多人姿态估计算法 90
5.2.1 网络架构设计 90
5.2.2 基于注意力的多尺度特征融合模型 91
5.2.3 尺度感知的关节点回归模型 94
5.3 实验结果与性能分析 95
5.3.1 多人姿态估计数据集 95
5.3.2 参数设置与评价指标 95
5.3.3 消融实验分析 97
5.3.4 与主流算法对比分析 98
5.4 本章小结 102
第6章 基于序列多尺度特征融合表示的层级舞蹈动作姿态估计 103
6.1 引言 103
6.2 基于序列多尺度特征融合表示的层级舞蹈动作姿态估计算法 104
6.2.1 基于YOLOv3的人体框检测 104
6.2.2 多尺度特征融合表示 105
6.2.3 基于关节点几何关系的层级姿态估计 107
6.2.4 损失函数 108
6.3 实验结果与性能分析 109
6.3.1 实验数据、对比算法及评价指标 109
6.3.2 实验设置 109
6.3.3 实验结果分析 109
6.4 本章小结 114
第三篇 3D人体姿态估计
第7章 基于时空注意力机制的3D人体姿态估计 117
7.1 引言 117
7.2 网络结构设计 118
7.3 基于时空注意力机制的3D人体姿态估计算法 119
7.3.1 骨架约束池化模型 119
7.3.2 时空注意力特征提取模型 120
7.3.3 多尺度特征融合模型 122
7.3.4 网络损失函数 122
7.4 实验结果与性能分析 123
7.4.1 3D姿态数据集 123
7.4.2 参数设置与评价指标 123
7.4.3 消融实验分析 124
7.4.4 与主流算法对比分析 125
7.4.5 可视化结果 128
7.5 本章小结 130
第8章 基于平行多尺度时空图卷积网络的3D人体姿态估计 131
8.1 引言 131
8.2 时空图卷积网络 132
8.3 平行多尺度时空图卷积模型 133
8.3.1 对角占优的时空注意力图卷积 134
8.3.2 平行多尺度时空图卷积网络 136
8.4 整体网络结构 139
8.5 实验结果与性能分析 140
8.5.1 数据集与评价指标 140
8.5.2 实验设置 140
8.5.3 实验结果分析 141
8.5.4 可视化结果 146
8.6 本章小结 147
第四篇 舞蹈姿态估计与对比分析
第9章 基于2D姿态估计的舞蹈动作相似度计算 151
9.1 引言 151
9.2 基于阶梯型相似度计算的 2D 舞蹈动作对比 152
9.2.1 关节点定位 152
9.2.2 偏移角度计算 153
9.2.3 相似度计算与姿态叠加 154
9.3 实验结果与性能分析 155
9.3.1 实验数据与环境 155
9.3.2 基于2D姿态估计的实验结果与分析 155
9.4 本章小结 158
第10章 基于3D姿态估计的舞蹈动作相似度计算 160
10.1 引言 160
10.2 基于上下文和跨点匹配的动态时间规整的舞蹈动作相似度计算 161
10.2.1 3D 骨骼关节点数据采集 161
10.2.2 舞蹈动作特征提取 162
10.2.3 基于CCDTW算法的动作时序对齐 164
10.3 实验结果与性能分析 167
10.3.1 实验数据与环境 167
10.3.2 动作相似度计算与纠正意见反馈 167
10.3.3 基于 3D 姿态估计的实验结果与分析 169
10.4 本章小结 170
第五篇 汉字字体自动生成
第11章 基于骨架信息的汉字字体生成方法 175
11.1 引言 175
11.2 网络架构设计 176
11.3 基于端到端骨架引导的字体生成模型 177
11.3.1 数据预处理 177
11.3.2 字体骨架合成网络 178
11.3.3 字体风格修正网络 180
11.3.4 网络损失函数 181
11.4 实验结果与性能分析 181
11.4.1 字体生成数据集 181
11.4.2 参数设置与评价指标 181
11.4.3 消融实验分析 183
11.4.4 与主流算法进行对比分析 185
11.4.5 拓展实验 190
11.5 本章小结 191
第六篇 应用篇
第12章 应用平台开发 195
12.1 引言 195
12.2 舞蹈动作相似度计算与对比分析平台 195
12.2.1 舞蹈动作姿态估计与对比分析的意义 195
12.2.2 舞蹈动作相似度计算软件平台 196
12.3 人工智能传统文化“活化”交互平台 197
12.3.1 传统文化元素“活化”的意义 197
12.3.2 人工智能传统文化“活化”交互平台软件 197
12.4 人工智能数字书法创作交互平台 198
12.4.1 数字书法创作的意义 198
x 智能视觉信息处理关键技术
12.4.2 人工智能数字书法创作交互平台软件 199
12.5 本章小结 200
参考文献 201