本书是《数据分析与R软件》第二版,在第一版的基础上,结合信息与计算科学及相关专业的最新培养目标及R软件的更新与发展进行了修订。
本次修订对第一版的主要内容进行了调整。第1章只介绍简单一元数据的探索性分析,学生新接触R软件,比较容易接受。第3章增加了多元统计分析的相关基础知识,为后面学习多元统计分析方法(回归分析、主成分分析、因子分析、聚类分析、判别分析、相关分析等)奠定理论基础,便于学生理解或证明相关结论。对R软件的使用也增加了一些必要的函数或功能介绍。同时删除了非参数统计的多样本问题等内容。
样章试读
目录
- 目录
第1章 探索性数据分析 1
1.1 数字特征 1
1.1.1 一元数据的数字特征 1
1.1.2 一元总体的数字特征 11
1.2 数据的分布 13
1.2.1 频数 (频率) 分布表与直方图 13
1.2.2 茎叶图、五数总括、箱线图 15
1.2.3 经验分布、QQ图及分布拟合检验 22
习题1 31
第2章 非参数统计 34
2.1 单样本问题 34
2.1.1 符号检验 34
2.1.2 趋势检验 37
2.1.3 游程检验 38
2.1.4 对称中心的检验 41
2.2 两样本问题 44
2.2.1 独立两样本位置参数的检验 45
2.2.2 独立样本刻度参数的检验 49
2.2.3 配对样本位置参数的检验 52
2.3 秩相关分析 53
2.3.1 Spearman秩相关系数 53
2.3.2 Kendall秩相关系数 56
2.4 二维列联表 58
习题2 61
第3章 多元统计分析相关基础 64
3.1 矩阵代数的相关知识 64
3.1.1 矩阵的微分运算 64
3.1.2 方阵的特征值和特征向量 66
3.2 多维随机向量 67
3.3 多元正态分布 71
3.3.1 多元正态分布的定义 71
3.3.2 与多元正态分布有关的R函数 72
3.3.3 由多元正态分布的导出分布 74
3.3.4 多元正态分布的参数估计 76
3.3.5 多元正态分布均值向量的假设检验 77
3.4 多元数据的数字特征 84
3.5 多元数据的图示 88
3.5.1 轮廓图 88
3.5.2 蛛网图 90
3.5.3 调和曲线图 92
习题3 94
第4章 回归分析 96
4.1 多元线性回归分析 97
4.1.1 多元线性回归模型 97
4.1.2 参数估计 98
4.1.3 回归模型的检验 100
4.1.4 回归诊断 106
4.2 自变量的选择与逐步回归 112
4.2.1 穷举法 113
4.2.2 逐步回归法 114
4.3 非线性回归模型 123
4.3.1 内在线性回归模型 123
4.3.2 内在非线性回归模型 124
4.4 Logistic回归模型 124
4.4.1 线性Logistic回归模型 125
4.4.2 参数的最大似然估计 125
习题4 130
第5章 主成分分析 133
5.1 总体主成分 133
5.1.1 总体主成分定义 133
5.1.2 总体主成分求法 134
5.1.3 总体主成分的性质 135
5.1.4 标准化变量的主成分 137
5.2 样本主成分 137
习题5 143
第6章 因子分析 145
6.1 因子分析模型 145
6.2 参数的统计意义及估计方法 145
6.2.1 参数的统计意义 145
6.2.2 因子载荷矩阵的估计 147
6.3 样本数据的因子分析 150
6.4 因子旋转 151
6.5 因子得分 154
6.5.1 加权最小二乘法 155
6.5.2 回归法 155
习题6 158
第7章 聚类分析 160
7.1 聚类分析的基本思想 160
7.2 聚类统计量 161
7.2.1 Q型聚类统计量——距离 161
7.2.2 R型聚类统计量——相似系数 162
7.3 系统聚类法 162
7.4 快速聚类法 171
7.4.1 凝聚点的选择 171
7.4.2 计算步骤 172
习题7 173
第8章 判别分析 176
8.1 距离判别 176
8.1.1 两个总体距离判别 177
8.1.2 多个总体距离判别 178
8.2 Bayes判别 181
8.2.1 两个总体Bayes判别 181
8.2.2 多个总体Bayes判别 184
8.3 Fisher判别 186
8.3.1 Fisher判别的基本思想 186
8.3.2 线性判别函数的求法 187
8.3.3 Fisher判别准则 188
8.4 逐步判别 193
8.4.1 逐步判别的基本思想 194
8.4.2 逐步判别的步骤 199
8.5 判别法则的评价 206
习题8 207
第9章 相关分析 208
9.1 相关系数的估计和检验 208
9.2 偏相关与复相关系数 210
9.2.1 偏相关系数 210
9.2.2 复相关系数 214
9.3 典型相关分析 217
9.3.1 典型相关分析的基本思想 217?
9.3.2 总体的典型相关分析 218
9.3.3 样本典型相关分析 221
9.3.4 典型相关系数的显著性检验 223
习题9 225
第10章 R软件的使用 227
10.1 R软件简介 227
10.2 下载安装及运行R等 227
10.3 R软件界面简介 228
10.4 获取R函数的帮助文档 232
10.5 对象及它们的模式和属性 232
10.6 向量运算及相关函数 235
10.6.1 向量 235
10.6.2 产生有规律序列 236
10.6.3 逻辑向量 238
10.6.4 缺失数据 238
10.6.5 字符型向量 239
10.6.6 向量的下标系统 239
10.7 因子 241
10.8 数组和矩阵 242
10.8.1 数组 242
10.8.2 数组的下标系统 243
10.8.3 矩阵 245
10.8.4 与数组 (矩阵) 运算的相关函数 247
10.9 列表与数据框 249
10.10 从文件中读取数据 252
10.10.1 文本文件 252
10.10.2 其他格式数据文件 255
10.10.3 使用R的内置数据集 255
10.10.4 大数据文件 256
10.11 写数据文件 256
10.12 成组、循环和条件控制 257
10.12.1 成组表达式 257
10.12.2 控制语句 257
10.13 R的统计表 260
10.14 R的绘图 262
10.14.1 高级绘图命令 262
10.14.2 低级图形函数 264
10.15 编写R函数 265
参考文献 267
索引 268