本书是国际学术界论述半监督学习理论与方法最为详细、内容最为丰富的一部著作。书中,数十位研究人员就半监督学习的各个方面阐述其研究成果,具体包含生成式模型、低密度分割、基于图的方法、表示的变换、半监督学习实践、视角六部分。
样章试读
目录
- 目录
《信息科学技术学术著作丛书》序
前言
第1章 半监督学习导论 1
1.1 有监督、无监督和半监督学习 1
1.2 何时半监督学习可以工作? 4
1.3 算法分类和本书组织 6
参考文献 10
第一部分 生成式模型
第2章 半监督学习的分类体系 15
2.1 半监督学习问题 15
2.2 半监督学习的范式 16
2.3 实例 22
2.4 结论 29
参考文献 30
第3章 用EM进行半监督的文本分类 32
3.1 概述 32
3.2 文本的生成式模型 34
3.3 基本EM算法的实验结果 39
3.4 使用更具表达能力的生成式模型 41
3.5 克服局部极大值的缺点 46
3.6 结论与总结 51
参考文献 51
第4章 半监督学习的风险 54
4.1 无标记数据对分类性能的影响 54
4.2 从渐进偏差的角度理解无标记数据的作用 57
4.3 生成式半监督学习方法的渐进分析 60
4.4 有标记数据和无标记数据的用途 63
4.5 有限样本集的影响 66
4.6 模型搜索和鲁棒性 67
4.7 结论 68
参考文献 68
第5章 有约束的概率半监督聚类方法 71
5.1 引言 71
5.2 基于HMRF的半监督聚类模型 73
5.3 HMRF-KMeans算法 77
5.4 获取约束的主动学习方法 89
5.5 实验结果 91
5.6 相关工作 96
5.7 结论 97
参考文献 98
第二部分 低密度分割
第6章 基于TSVM的半监督学习 105
6.1 引言 105
6.2 TSVM 107
6.3 在测试集上使用边缘的原因 110
6.4 TSVM的实验和应用 111
6.5 解决TSVM的优化问题 113
6.6 与其他相关算法的联系 114
6.7 结论与总结 115
参考文献 115
第7章 基于SDP的半监督学习 118
7.1 SVM直推问题的松弛 118
7.2 加速近似 124
7.3 一般的半监督学习情形 126
7.4 经验结果 127
7.5 小结 130
7.6 附录 130
参考文献 132
第8章 高斯过程与空类别噪声模型 134
8.1 引言 134
8.2 噪声模型 137
8.3 过程模型与空类别的效果 139
8.4 后验推断与预测 141
8.5 结果 143
8.6 讨论 147
参考文献 147
第9章 熵正则化 148
9.1 引言 148
9.2 准则的推导 149
9.3 最优化算法 152
9.4 相关方法 154
9.5 实验 156
9.6 结论 161
参考文献 163
第10章 数据相关的正则方法 166
10.1 引言 166
10.2 度量空间中的信息正则 170
10.3 信息正则与关系数据 179
10.4 讨论 186
参考文献 186
第三部分 基于图的方法
第11章 标签传播和二次准则 191
11.1 引言 191
11.2 基于相似度图的标签传播 192
11.3 二次代价准则 196
11.4 从直推式学习到归纳式学习 202
11.5 融合类先验知识 203
11.6 半监督学习的维度灾难 204
11.7 讨论 211
参考文献 212
第12章 半监督学习的几何基础 214
12.1 引言 214
12.2 正则中引入几何 216
12.3 算法 219
12.4 半监督学习中数据相关的核 224
12.5 大规模半监督学习的线性方法 226
12.6 其他关联算法和相关工作 228
12.7 未来工作 230
参考文献 230
第13章 离散正则 232
13.1 引言 232
13.2 离散分析 233
13.3 离散正则 239
13.4 结论 242
参考文献 243
第14章 基于条件调和混合的半监督学习 244
14.1 引言 244
14.2 CHM 247
14.3 CHM模型的学习 248
14.4 融入先验知识 252
14.5 学习条件分布 253
14.6 模型平均 253
14.7 实验 254
14.8 结论 263
参考文献 263
第四部分 表示的变换
第15章 谱变换图核 269
15.1 图拉普拉斯 269
15.2 谱变换核 271
15.3 核对齐 273
15.4 使用QCQP为半监督学习优化对齐 273
15.5 序约束的半监督核 274
15.6 实验结果 276
15.7 结论 282
参考文献 283
第16章 使用谱方法进行维度约减 284
16.1 引言 284
16.2 线性方法 285
16.3 基于图的方法 287
16.4 核方法 292
16.5 讨论 295
参考文献 297
第17章 修正距离 299
17.1 引言 299
17.2 估计DBD度量 302
17.3 计算DBD度量 311
17.4 采用基于密度的度量的半监督学习 317
17.5 结论和未来工作 319
参考文献 319
第五部分 半监督学习实践
第18章 大规模算法 323
18.1 引言 323
18.2 代价近似 324
18.3 子集选择 327
18.4 讨论 330
参考文献 331
第19章 使用聚类核的半监督蛋白质分类 332
19.1 引言 332
19.2 蛋白质序列的表示与核 334
19.3 蛋白质序列的半监督核 336
19.4 实验 340
19.5 讨论 346
参考文献 347
第20章 网络中的蛋白质功能预测 350
20.1 引言 350
20.2 基于图的半监督学习方法 353
20.3 结合多张图 354
20.4 蛋白质功能预测的实验 357
20.5 结论和展望 362
参考文献 362
第21章 基准测试分析 365
21.1 基准测试 365
21.2 半监督学习方法应用 370
21.3 结果与讨论 377
参考文献 381
第六部分 视 角
第22章 用于半监督学习的一个扩展PAC模型 385
22.1 引言 385
22.2 一个形式化的框架 388
22.3 样本复杂度结果 390
22.4 算法的结果 399
22.5 相关模型和讨论 403
参考文献 406
第23章 基于度量的半监督分类和回归方法 410
23.1 引言 410
23.2 半监督学习的度量结构 411
23.3 模型选择 414
23.4 正则 424
23.5 分类 432
23.6 结论 437
参考文献 438
第24章 直推式学习和半监督学习 441
24.1 问题设置 441
24.2 归纳式和直推式学习的泛化问题 442
24.3 VC界的结构和直推式学习 444
24.4 对称化引理和直推式 445
24.5 直推式学习的界 447
24.6 归纳和直推的结构风险最小原理 447
24.7 直推式学习中的组合学 449
24.8 等价类大小的度量 449
24.9 归纳和直推式SVM的算法 451
24.10 半监督学习 455
24.11 直推式学习和学习的新问题 456
24.12 选择性推理 456
参考文献 457
第25章 关于半监督学习和直推式学习的一个讨论 459
参考文献 462