空间数据挖掘是数据科学研究的重要方向,旨在探测空间数据中隐含的知识和空间关系,发现有用的特征和模式。本书是作者团队在完成国家自然科学基金项目、郑州大学高层次人才项目基础上撰写而成,主要反映作者团队围绕空间聚类分析和变化检测、空间关联规则挖掘、互联网专题信息挖掘、轨迹数据挖掘以及气象数据流挖掘等方面所取得的一系列进展。书中详解空间数据挖掘方法创新和应用实践,为深化空间数据挖掘研究拓展新思路。
样章试读
目录
- 目录
序
作者序
前言
第1章 顾及限定规则的空间聚类 1
1.1 空间聚类限定规则问题 1
1.1.1 限定规则问题 1
1.1.2 限定规则问题定义及相关概念 3
1.2 附加限定规则的空间聚类 3
1.2.1 附加空间限定规则的空间聚类 4
1.2.2 附加非空间属性限定规则的空间聚类 8
1.2.3 附加方位因素的空间聚类 13
1.3 空间聚类结果分级处理 16
1.3.1 非空间属性的分级处理 16
1.3.2 空间方位因素的分级处理 18
1.4 算法实现及应用 23
1.4.1 实验数据及预处理 23
1.4.2 算法实现 24
1.4.3 算法应用实例 30
第2章 基于人工蜂群算法的空间聚类 34
2.1 人工蜂群算法及改进 34
2.1.1 人工蜂群算法 34
2.1.2 人工蜂群算法改进 38
2.1.3 算法改进测试 39
2.2 人工蜂群聚类算法 47
2.2.1 FCM算法和HCM算法 47
2.2.2 群智能聚类算法 51
2.2.3 算法比较分析 53
2.3 人工蜂群算法的空间聚类应用 56
2.3.1 实验数据 56
2.3.2 数据预处理 58
2.3.3 实验结果及分析 62
第3章 数据流的空间聚类变化检测 65
3.1 数据流相关概念及算法 65
3.1.1 数据流相关概念 65
3.1.2 数据流聚类算法 67
3.1.3 基于动态图的聚类变化挖掘 74
3.2 基于实时聚类快照的空间聚类变化检测 75
3.2.1 基于网格索引的DenStream算法优化 75
3.2.2 在线阶段的实时聚类快照截取 79
3.2.3 基于快照的聚类变化分析 80
3.2.4 实验与结果分析 84
3.3 基于滑动窗口的空间聚类变化检测 89
3.3.1 基于滑动窗口的在线聚类更新 89
3.3.2 基于图的空间聚类变化分析 95
3.3.3 实验与结果分析 97
3.4 应用实例——城市犯罪数据流模拟及聚类演化分析 99
第4章 量化空间关联规则挖掘应用 110
4.1 量化关联规则问题 110
4.1.1 关联规则挖掘相关概念 110
4.1.2 量化关联规则挖掘问题 112
4.2 空间数据预处理 115
4.2.1 基于聚类的空间数据离散化 115
4.2.2 聚类算法优化 117
4.2.3 基于行政区划的空间数据离散化 123
4.2.4 事务数据库构建 124
4.3 量化空间关联规则挖掘 125
4.3.1 包含事务信息的FP-tree 126
4.3.2 FPT-growth算法 129
4.3.3 基于模拟退火的量化关联规则挖掘 131
4.4 实验及分析 138
4.4.1 使用聚类数据进行定量关联规则挖掘 138
4.4.2 使用行政区划数据进行定量关联规则挖掘 143
4.4.3 实验结果分析 145
第5章 基于粒子群的模糊空间关联规则挖掘 147
5.1 基于粒子群的隶属函数优化方法 147
5.1.1 基本粒子群优化算法 147
5.1.2 隶属函数及其优化 149
5.1.3 优化算法描述 154
5.1.4 实验结果及分析 156
5.2 模糊空间关联规则挖掘方法 160
5.2.1 模糊集与模糊关联规则 160
5.2.2 全模糊区域频繁模式挖掘算法 163
5.2.3 基于改进粒子群算法的关联规则提取 167
5.3 模糊空间关联规则应用研究 173
5.3.1 数据准备与数据预处理 173
5.3.2 挖掘结果分析及检验 177
5.3.3 结果检验 178
第6章 本体辅助的空间关联规则挖掘 183
6.1 本体及其构建 183
6.1.1 本体基本概念 183
6.1.2 本体的结构与构建原则 184
6.1.3 基于语义收缩的本体构建 185
6.2 本体辅助的空间关联规则挖掘数据预处理 191
6.2.1 本体辅助的数据清理 191
6.2.2 本体辅助的数据归约 196
6.2.3 实验及评价 200
6.3 基于本体语义约束的空间频繁模式挖掘 207
6.3.1 空间依赖分析 207
6.3.2 基于概念格的空间依赖剔除 211
6.3.3 本体语义应用的实现 213
6.3.4 实验及其评价 214
6.4 本体辅助的空间关联规则挖掘结果优化 218
6.4.1 规则的生成和知识的表达 219
6.4.2 基于规则模式的规则选取 223
6.4.3 基于本体语义相似度的规则过滤 226
6.4.4 实验分析 227
第7章 本体辅助的中文文本自然灾害专题信息挖掘 232
7.1 中文文本时空信息获取及解析方法 232
7.1.1 地名本体、事件本体和灾害本体 232
7.1.2 面向主题的网页信息获取 233
7.1.3 文本中时空信息解析方法 233
7.1.4 文本中事件信息抽取方法 235
7.2 基于地名本体的地名知识表达方法 237
7.2.1 基于地名本体的地名知识建模 237
7.2.2 地名本体定性空间推理机制 243
7.2.3 地名知识库构建 244
7.3 面向事件的自然灾害领域本体构建 248
7.3.1 相关概念与技术方法 248
7.3.2 自然灾害事件领域知识分析 251
7.3.3 自然灾害事件领域本体建模与表达 257
7.3.4 自然灾害事件领域本体评价 260
7.4 顾及本体语义的自然灾害信息主题爬虫 264
7.4.1 主题爬虫技术基础 264
7.4.2 本体语义支持的自然灾害主题爬虫框架 268
7.4.3 基于语义和HTML位置加权的网页文本主题相关度计算 269
7.4.4 基于主题相关度的链接分析改进方法 275
7.4.5 测试与分析 277
7.5 非结构化中文文本自然灾害事件专题信息解析 280
7.5.1 相关技术基础 280
7.5.2 基于规则和推理的中文文本时间信息解析 282
7.5.3 基于本体标注的中文文本地名识别 288
7.5.4 中文文本自然灾害事件时空信息合并 291
7.5.5 基于复合特征的自然灾害事件类型识别 293
7.5.6 基于事件本体和模式匹配的自然灾害事件属性元素抽取 302
7.6 自然灾害事件时空信息匹配与可视化 308
7.6.1 自然灾害事件时空信息匹配 308
7.6.2 地名知识辅助的中文文本地名消歧 308
7.6.3 自然灾害事件可视化表达与分析 313
7.6.4 应用实例——以地震灾害为例 319
第8章 基于出租车轨迹数据的异常事件检测 323
8.1 出租车轨迹数据分析概述 323
8.1.1 轨迹数据相关知识 323
8.1.2 轨迹数据分析 325
8.1.3 聚类分析与异常检测 327
8.2 出租车异常轨迹模式发现 3308.2.1 相关定义 331
8.2.2 异常轨迹模式发现 333
8.2.3 实验与分析 338
8.3 事件检测与分析 342
8.3.1 基于LRT的元事件检测 343
8.3.2 元事件统计分析 348
8.3.3 复合时空事件的提取与分析 352
8.4 异常聚集行为检测 356
8.4.1 聚集行为发现 356
8.4.2 聚集行为模式分析与异常检测 361
第9章 基于出租车数据和POI的城市空间行为特征分析 369
9.1 数据准备与数据预处理 369
9.1.1 研究区域与数据准备 369
9.1.2 出租车数据预处理 370
9.1.3 POI数据预处理 373
9.2 城市功能区识别及主要交通枢纽空间分析 373
9.2.1 基于POI数据的城市功能区识别 373
9.2.2 城市功能区识别结果分析 376
9.2.3 交通用地的服务范围及空间联系强度分析 377
9.3 基于密度聚类的热点路段及区域挖掘 381
9.3.1 密度聚类算法的改进 382
9.3.2 热点路段时空分布与分析 387
9.3.3 热点区域POI热度指数计算与分析 389
9.4 基于时空谱聚类的出行特征挖掘 396
9.4.1 相似性度量方法及其改进 396
9.4.2 谱聚类算法的时空及功能区拓展 398
9.4.3 实验结果与分析 401
第10章 再分析计划气象数据流挖掘 411
10.1 气象数据流挖掘基础知识 411
10.1.1 相关概念 411
10.1.2 气象数据流的组织与管理 414
10.1.3 数据流挖掘基本算法 416
10.2 面向事件的气象数据流滑动窗口查询 417
10.2.1 基于事件的元对象查询 418
10.2.2 气象数据流滑动窗口查询方法 422
10.3 面向异常时空数据模型的气象数据流异常检测 424
10.3.1 面向异常时空数据模型 424
10.3.2 数据流的异常检测 427
10.3.3 气象数据流的异常检测实验 429
10.4 面向异常分类时空数据模型的气象数据流异常分类 438
10.4.1 面向异常分类时空数据模型 438
10.4.2 数据流的异常分类 440
10.4.3 气象数据流的异常分类实验 445
10.5 面向异常频繁时空数据模型的气象数据流异常频繁挖掘 449
10.5.1 面向异常频繁时空数据模型 449
10.5.2 数据流的异常频繁挖掘 452
10.5.3 气象数据流的异常频繁挖掘实验 455
10.6 面向属性分布时空数据模型的气象数据流高维聚类 462
10.6.1 面向属性分布时空数据模型 463
10.6.2 数据流的高维聚类 465
10.6.3 气象数据流的高维聚类实验 469
参考文献 477
后记 485