本书主要介绍数据统计建模的线性回归模型和时间序列模型等典型理论方法,系统阐述这些应用统计方法及其拓展推广,包括模型选择、参数估计、假设检验、优化和预测等。全书分为三部分:第1章为概率统计知识基础、第2至6章为回归分析、第7至12章为时间序列分析。本书的编写兼顾了理论性和实用性,不仅结合金融管理等领域实例和开源R语言进行案例分析,还在书后附加详细的R语言程序代码。
样章试读
目录
- 目录
前言
第1章 概率统计知识基础 1
1.1 随机变量及其分布 1
1.1.1 随机变量 1
1.1.2 概率分布 2
1.1.3 累积概率分布 7
1.1.4 随机变量函数的分布 9
1.2 随机变量的数字特征 17
1.2.1 数学期望 17
1.2.2 方差 20
1.2.3 矩与特征函数 24
1.2.4 协方差与相关系数 27
1.2.5 分位数 29
1.3 参数估计方法 30
1.3.1 点估计 30
1.3.2 区间估计 34
1.4 假设检验 35
1.4.1 原假设与备择假设 35
1.4.2 拒绝域和显著性水平 36
1.4.3 常见的假设检验 37
习题1 46
第2章 一元线性回归 48
2.1 回归分析的发展和一般模型 48
2.2 一元回归模型简介 50
2.2.1 一元线性回归模型 50
2.2.2 回归模型的基本假定 52
2.3 一元回归的参数估计及其性质 53
2.3.1 普通最小二乘估计 53
2.3.2 OLS估计的基本性质 57
2.3.3 最大似然估计 61
2.4 一元回归的拟合优度 62
2.4.1 方差分析 62
2.4.2 R2 和相关系数 63
2.5 一元回归的显著性检验 64
2.5.1 回归系数的显著性检验与区间估计 64
2.5.2 回归模型的显著性检验 67
2.6 残差分析与预测 68
2.6.1 残差分析 68
2.6.2 预测 70
习题2 75
第3章 多元线性回归 78
3.1 多元线性回归模型简介 78
3.1.1 多元线性回归模型 78
3.1.2 回归模型的基本假定 80
3.2 多元线性回归的参数估计及其性质 81
3.2.1 多元线性回归的参数估计 81
3.2.2 OLS 估计的基本性质 83
3.2.3 最大似然估计 84
3.2.4 回归方程的解读 85
3.3 多元线性回归的显著性检验 87
3.3.1 拟合优度检验 87
3.3.2 回归模型的显著性检验 89
3.3.3 回归系数的显著性检验 90
3.3.4 回归系数的区间估计 92
3.4 多元回归的预测 94
3.4.1 平均值的区间预测 95
3.4.2 单值的区间预测 95
3.5 中心化与标准化回归模型 96
3.5.1 中心化回归模型 96
3.5.2 标准化回归模型 97
3.5.3 非线性模型的标准化 97
习题3 100
第4章 违背基本假设的回归分析处理 103
4.1 异方差及其识别 103
4.1.1 异方差的概念和影响 103
4.1.2 异方差的识别方法 104
4.1.3 异方差的处理方法 109
4.1.4 加权最小二乘方法 110
4.2 自相关问题及其识别113
4.2.1 自相关的产生原因 113
4.2.2 自相关的检验 114
4.2.3 自相关的处理方法 117
4.3 异常值和强影响点及其识别 121
4.3.1 异常值的识别 121
4.3.2 强影响点的识别 122
4.3.3 异常值和强影响点的处理 125
4.4 多重共线性及其识别126
4.4.1 多重共线性的概念和影响 126
4.4.2 多重共线性的识别 128
4.4.3 多重共线性的处理 131
习题4 132
第5章 线性回归模型的变量选择 134
5.1 自变量选择简介 134
5.1.1 全模型和选模型 134
5.1.2 自变量选择错误的影响 135
5.2 所有子集回归 138
5.2.1 最优子集回归 138
5.2.2 变量选择准则 140
5.3 逐步回归 147
5.3.1 前向和后向选择 147
5.3.2 逐步回归法 149
习题5 152
第6章 回归方法拓展 156
6.1 线性回归拓展 156
6.1.1 主成分回归 156
6.1.2 岭回归 161
6.1.3 Lasso 方法 169
6.2 非线性回归 171
6.3 属性变量回归 178
6.3.1 虚拟解释变量回归 178
6.3.2 Logistic回归 186
习题6 192
第7章 时间序列的预处理 197
7.1 时间序列分析简介 197
7.1.1 时间序列的定义 197
7.1.2 时间序列分析方法 198
7.1.3 时间序列分析的发展史 198
7.2 平稳时间序列 199
7.2.1 特征统计量 199
7.2.2 平稳性的定义 201
7.2.3 平稳性的检验 202
7.2.4 白噪声检验 205
7.3 平稳化方法 207
7.3.1 分解定理 207
7.3.2 确定性因素分解法 208
习题7 214
第8章 线性时间序列模型 216
8.1 方法性工具 216
8.1.1 差分运算 216
8.1.2 滞后算子 217
8.1.3 线性差分方程 217
8.2 自回归模型 220
8.2.1 AR模型的定义 220
8.2.2 AR模型的统计性质 221
8.3 移动平均模型 227
8.3.1 MA模型的定义 227
8.3.2 MA模型的统计性质 227
8.4 自回归移动平均模型230
8.4.1 ARMA模型的定义 230
8.4.2 ARMA模型的因果可逆过程 231
8.4.3 ARMA模型的统计性质 232
习题8 234
第9章 线性时间序列的建模与预测 235
9.1 自回归模型 235
9.1.1 参数估计 235
9.1.2 模型检验和优化 237
9.1.3 序列预测 238
9.2 移动平均模型 240
9.2.1 参数估计 240
9.2.2 模型检验和优化 241
9.2.3 序列预测 242
9.3 自回归移动平均模型243
9.3.1 参数估计 243
9.3.2 序列预测 244
9.4 线性时间序列模型的定阶 245
9.4.1 图形辨识法 245
9.4.2 信息准则法 247
9.4.3 模型诊断法 248
9.5 线性时间序列建模小结 250
习题9 253
第10章 时间序列模型的拓展 255
10.1 ARIMA模型 255
10.1.1 模型的定义 255
10.1.2 模型的性质 259
10.1.3 模型的建模 260
10.1.4 模型的应用 261
10.2 ARCH模型 264
10.2.1 模型的定义 264
10.2.2 模型的性质 265
10.2.3 模型的建模 267
10.2.4 模型的应用 267
10.2.5 GARCH模型及其应用 271
习题10 273
第11章 多元时间序列介绍 275
11.1 多元平稳时间序列 275
11.1.1 多元平稳时间序列的定义 275
11.1.2 均值和自协方差函数的估计 276
11.2 ARIMAX模型 277
11.2.1 ARIMAX模型的定义和性质 277
11.2.2 ARIMAX模型的建模 277
11.2.3 案例分析 279
11.3 向量自回归模型 280
11.3.1 VAR模型的定义和性质 280
11.3.2 VAR模型的建模 281
11.4 协整与因果关系 284
11.4.1 伪回归 284
11.4.2 协整的定义 285
11.4.3 协整的检验 285
11.4.4 Granger因果性的定义 287
11.4.5 Granger因果检验 288
习题11 289
第12章 时间序列的谱表示 290
12.1 谱分布与谱密度 290
12.2 平稳序列的周期图 293
12.2.1 周期图的定义 293
12.2.2 周期图的性质 295
12.3 加窗谱估计.297
12.3.1 加时窗的谱估计 297
12.3.2 加谱窗的谱估计 298
12.3.3 常用谱窗和时窗 300
12.4 平稳序列的谱表示 302
12.4.1 谱表示定理 302
12.4.2 线性平稳序列的谱表示 303
12.4.3 离散谱序列的特征 304
12.4.4 离散谱序列的随机测度 306
12.4.5 平稳序列的分解 308
12.4.6 ARMA序列的谱表示 308
习题12 310
参考文献 311
附录 全书R语言程序代码 312