本书系统总结了作者近几年在粗糙集理论、模型、算法和应用方面的研究成果,以分类决策中人们普遍使用的若干一致性假设为主线,论述了等价关系、邻域关系、模糊关系以及优势关系下的粒化和近似问题,进而分析了各种关系诱导出来的近似空间的不确定性度量问题。本书的特点是理论分析、算法设计和实际应用相结合,将粗糙集理论应用于模式识别、机器学习和数据挖掘的算法设计,形成了特征依赖性分析、特征选择、属性约筒、样本约简以及规则学习等算法。
样章试读
目录
- 目录
《信息科学技术学术著作丛书》序
前言
第1章 绪论 1
1.1 复杂数据的知识发现 1
1.2 混合数据分类建模的不确定性分析 2
1.2.1 数据类型及其信息结构分析 2
1.2.2 混合数据分类的不确定性分析 5
1.3 基于粗糙集的分类不确定性刻画 6
1.3.1 粗糙计算模型的发展 7
1.3.2 粗糙计算算法设计现状 9
1.3.3 现有粗糙集模型处理混合数据存在的问题 11
1.4 对当前若干粗糙计算观点的评述 13
1.4.1 粗糙计算中分类能力定义的评述 13
1.4.2 粒计算、词计算与粗糙计算的多样性 15
第2章 集合论基础 18
2.1 集合 18
2.2 模糊集 24
第3章 Pawlak粗糙集模型 31
3.1 粗糙集理论的基本概念 31
3.2 约简和相对约简 35
3.3 基于粗糙集的分类建模 39
3.3.1 属性约简 39
3.3.2 规则提取 41
3.3.3 分类决策 44
第4章 度量空间分类学习的邻域粗糙集模型 45
4.1 基于邻域粒化的混合数据分析模型 45
4.1.1 邻域粗糙集 45
4.1.2 邻域决策系统 48
4.1.3 关于邻域粗糙集的理解 51
4.1.4 基于邻域模型的多粒度可分性分析 53
4.2 基于邻域粗糙集的边界样本选择 56
4.3 基于邻域粗糙集的混合数据属性约简 60
4.3.1 算法设计 60
4.3.2 测试分析 63
4.4 基于邻域一致性分析的属性约简 67
4.4.1 邻域依赖度指标存在的问题 67
4.4.2 邻域一致性指标及特性分析 69
4.4.3 算法设计 71
4.4.4 测试分析 72
4.5 基于邻域覆盖约简的分类规则学习 74
第5章 模糊分类学习的模糊粗糙集模型 79
5.1 模糊算子 79
5.2 模糊粗糙集 81
5.3 基于核函数的模糊粗糙逼近 84
5.3.1 模糊粗糙集与核学习机器的潜在联系 84
5.3.2 核模糊粗糙集模型 86
5.3.3 基于核的分类逼近 88
5.4 基于核模糊逼近的属性依赖性分析 94
5.5 核模糊粗糙集与ReliefF算法的关系 97
5.6 鲁棒的软模糊粗糙集模型 100
5.7 基于核模糊逼近的混合数据属性约简 103
5.7.1 算法设计 103
5.7.2 测试分析 106
5.8 基于核模糊逼近的样本加权采样 108
5.8.1 KNN中样本选择研究现状 108
5.8.2 FAIR-KNN算法设计 109
5.8.3 实验分析 112
第6章 有序分类的优势关系粗糙集模型 120
6.1 有序决策表 120
6.2 优势关系粗糙集和有序分类 122
6.3 有序决策表约简 125
6.4 模糊优势关系粗糙集 126
6.4.1 模糊优势关系 126
6.4.2 模糊优势决策近似 129
6.5 多类型属性共存时的有序决策分析模型 135
6.6 近似质量分析和有序决策约简 136
6.7 应用分析139
第7章 近似空间的信息度量 148
7.1 等价关系信息系统的信息度量 148
7.1.1 信息熵 148
7.1.2 Pawlak近似空间的信息度量 150
7.2 邻域系统的信息度量 152
7.3 模糊近似空间的信息度量 155
7.3.1 模糊关系的信息熵及性质 155
7.3.2 Pawlak近似空间的Shannon熵与模糊熵的关系 158
7.3.3 模糊近似空间的模糊信息度量 161
7.4 有序分类的不确定性度量 163
7.4.1 清晰序关系下的信息度量 164
7.4.2 模糊优势关系下的信息度量 169
7.5 基于信息熵的混合数据约简方法 171
7.6 依赖度、一致度和互信息之间的关系 172
参考文献 175