大数据教程：数据分析原理和方法_概率论/数理统计_数学_图书分类

热门关键词： 颠覆性技术创新研究现代数学基础丛书

0去购物车结算: 购物车中还没有商品，赶紧选购吧！

全部商品分类

网上书店按需印刷电子书

当前位置: 图书分类 > 数学 > 概率论/数理统计 > 大数据教程：数据分析原理和方法

相同语种的商品

SAS软件实用教程（第二版）
售价：￥37.92元

基因组学方法
售价：￥47.24元

线性代数
售价：￥30.02元

蛋白质纯化指南（原书第二版）
售价：￥144.00元

精编蛋白质科学实验指南
售价：￥195.92元

企业管理信息系统
售价：￥29.23元

生态学考研精解
售价：￥27.65元

真空镀膜原理与技术
售价：￥43.45元

大学文科数学
售价：￥39.20元

对现代规范伦理学的颠破
售价：￥46.61元

销售排行榜

2013年度司法鉴定能力验证文书评析
￥150.10元

司法鉴定科技前瞻
￥94.80元

2015司法鉴定能力验证鉴定文书评析
￥181.70元

2018司法鉴定能力验证文书评析
￥300.20元

2012司法鉴定能力验证鉴定文书评析
￥126.40元

2016司法鉴定能力验证鉴定文书评析
￥276.50元

司法鉴定——复所30年司法鉴定案例精选
￥142.20元

现代印章印文司法鉴定
￥300.20元

2010司法鉴定能力验证文书评析
￥181.70元

2011司法鉴定能力验证鉴定文书评析
￥90.06元

浏览历史

非创不可-创业我有料，你有梦想吗？
售价：￥86.90元

小学生安全教育读本（4～6年级）
售价：￥15.64元

应用非参数统计（第二版）
售价：￥77.42元

毒性中药学
售价：￥94.80元

文化遗产研究.第4辑
售价：￥211.72元

环境规制、能源生态效率与区域生态安全问题研究
售价：￥101.91元

发展性协调障碍青少年视空间注意缺陷：来自ERP的证据
售价：￥78.21元

[清空]

联系编辑

标题：

内容：

联系方式：

大数据教程：数据分析原理和方法

书号：9787030632982

作者：林正炎等
外文书名：
装帧：平装

开本：B5
页数：377

字数：500000

语种：zh-Hans
出版社：科学出版社

出版时间：2020-12-01
所属分类：概率论/数理统计
定价： ￥148.00元

售价： ￥116.92元

图书介质:

纸质书按需印刷

购买数量： 件可供
商品总价：

内容介绍

样章试读

用户评论

全部咨询

本书试图较全面地介绍大数据技术的基本原理和方法，包括以统计模型为主的各类数据模型以及它们的计算方法，同时还将介绍这些方法在一些领域(如人工智能)中的应用。

样章试读

暂时还没有任何用户评论

总计 0 个记录，共 1 页。第一页上一页下一页最末页

全部咨询(共0条问答)

暂时还没有任何用户咨询内容

总计 0 个记录，共 1 页。第一页上一页下一页最末页

用户名：匿名用户

E-mail：

咨询内容：

目录
前言
第1章引言 1
1.1 什么是大数据 1
1.1.1 大数据概论 1
1.1.2 大数据的特点 1
1.1.3 大数据带来的利益 2
1.1.4 大数据的类型 3
1.2 数据分析过程 4
1.3 专业领域知识 4
1.3.1 统计学 5
1.3.2 数据挖掘 5
1.3.3 机器学习 5
1.3.4 人工智能 6
1.3.5 数学 6
1.4 数据科学家做什么? 6
1.4.1 学术界 6
1.4.2 工业界 6
第2章大数据的预处理、存储和计算 8
2.1 数据的预处理 8
2.1.1 数据源 9
2.1.2 数据格式 9
2.1.3 数据形式 10
2.2 数据清洗 11
2.2.1 数据清洗的系统框架 12
2.2.2 待清洗数据的主要类型 12
2.2.3 数据检测算法和清洗算法 13
2.2.4 数据清洗评估 16
2.3 云存储和云计算* 17
习题2 18
第3章数据可视化 20
3.1 基本原理 20
3.2 实现过程 20
3.3 可视化工具 21
3.4 数据可视化方法 21
第4章回归与分类(一) 25
4.1 线性回归 25
4.1.1 模型介绍 26
4.1.2 参数估计 28
4.1.3 假设检验 32
4.1.4 模型评价与诊断 35
4.1.5 预测 39
4.2 线性回归的推广* 40
4.2.1 多项式回归 41
4.2.2 样条回归 43
4.2.3 局部回归 47
4.2.4 广义加性模型 52
4.2.5 回归性能的度量 54
4.3 时间序列分析 57
4.3.1 AR(p)模型 57
4.3.2 MA(q)模型 60
4.3.3 ARMA(p,q)模型 63
4.4 逻辑斯谛回归 68
4.5 判别分类 72
4.5.1 线性判别分析 72
4.5.2 二次判别分析 75
4.6 k最近邻分类 76
习题4 78
第5章回归与分类(二) 81
5.1 决策树 81
5.1.1 回归树 82
5.1.2 分类树 88
5.1.3 决策树的优缺点 91
5.2 Bagging分类 91
5.3 随机森林分类 96
5.4 AdaBoost分类 98
5.5 支持向量机分类 103
5.5.1 最大间隔分类器 103
5.5.2 支持向量分类器 109
5.5.3 支持向量机 113
5.5.4 多分类的支持向量机 118
习题5 118
第6章聚类及相关数据分析 120
6.1 聚类分析 120
6.1.1 距离的定义 120
6.1.2 系统聚类法 127
6.1.3 K{均值聚类 130
6.2 文本分析 134
6.2.1 基本概念 134
6.2.2 处理过程和任务 136
6.2.3 特征处理 138
6.2.4 文本表示模型 139
6.2.5 文本分类与文本聚类 143
6.2.6 应用实例 144
6.2.7 分布式文本挖掘 147
6.3 网络图形描述和模型* 148
6.3.1 图的基本概念 148
6.3.2 复杂网络的统计特征 149
6.3.3 小世界现象 151
6.3.4 模型介绍 154
6.4 网络数据分析和图形模型 157
6.4.1 网络数据概述 157
6.4.2 网络数据收集 158
6.4.3 网络数据分析 160
6.5 关联规则和推荐系统 164
6.5.1 关联规则 164
6.5.2 推荐系统 166
6.5.3 基于内容的推荐系统设计过程 169
习题6 170
第7章高维统计中的变量选择 173
7.1 经典降维方法 173
7.1.1 主成分分析 173
7.1.2 因子分析 178
7.2 Lasso模型及其变形 185
7.2.1 Lasso基本方法 185
7.2.2 Lasso方法的拓展 188
7.2.3 其他降维方法 196
7.3 流形降维方法* 204
7.3.1 核主成分分析 205
7.3.2 局部线性嵌入 206
7.3.3 多维缩放 208
7.3.4 Isomap 209
7.4 非负矩阵分解* 210
7.4.1 基本原理 210
7.4.2 NMF的求解方法 211
7.4.3 应用 212
7.5 自编码器 212
7.5.1 基本原理 213
7.5.2 可视化自编码器 215
7.6 t-SNE 216
7.6.1 算法 216
7.6.2 应用 217
7.7 正则化方法 218
7.7.1 多项式拟合 218
7.7.2 过拟合和欠拟合 221
7.7.3 L2正则 222
7.7.4 L1正则 224
7.7.5 缩减参数的选取 225
习题7 225
第8章最大期望算法(EM算法) 227
8.1 预备知识 228
8.2 算法描述 229
8.3 算法导出* 230
8.4 EM算法的应用 232
8.4.1 简单实例——抛投硬币实验 232
8.4.2 男女生身高实例——混合高斯模型 235
习题8 240
第9章贝叶斯方法 242
9.1 引论 242
9.2 贝叶斯统计推断 243
9.2.1 一个例子 243
9.2.2 确定先验分布 244
9.2.3 点估计 245
9.2.4 区间估计 245
9.2.5 假设检验 246
9.3 贝叶斯方法在变量选择中的应用 246
9.3.1 贝叶斯模型选择 246
9.3.2 采样 248
9.3.3 贝叶斯变量选择 249
习题9 250
第10章隐马尔可夫模型 252
10.1 隐马尔可夫模型的基本概念 252
10.1.1 马尔可夫链 252
10.1.2 隐马尔可夫模型 253
10.1.3 观测序列的生成过程 257
10.1.4 隐马尔可夫模型的三个基本问题 257
10.2 概率计算算法 258
10.2.1 前向算法 258
10.2.2 后向算法 260
10.2.3 一些概率与期望值的计算 261
10.3 学习算法 262
10.3.1 监督学习方法 262
10.3.2 Baum-Welch算法 263
10.3.3 Baum-Welch模型参数估计 265
10.4 预测算法 266
10.4.1 近似算法 266
10.4.2 维特比算法 267
习题10 271
第11章神经网络与深度学习 272
11.1 引言 272
11.2 神经网络 272
11.2.1 简介 272
11.2.2 神经元 274
11.2.3 感知器 275
11.2.4 神经网络模型 276
11.2.5 激活函数 278
11.2.6 代价函数 280
11.2.7 梯度下降法 281
11.2.8 反向传播算法 283
11.2.9 梯度检验 285
11.3 深度神经网络 285
11.4 卷积神经网络 286
11.4.1 卷积 287
11.4.2 卷积层 288
11.4.3 池化层 291
11.4.4 卷积神经网络的网络架构 292
11.4.5 权值的训练 293
11.4.6 LeNet-5卷积神经网络 295
11.5 循环神经网络 297
11.5.1 简单循环神经网络 297
11.5.2 基于时间的反向传播算法 299
11.5.3 梯度消失和梯度爆炸 302
11.5.4 长短时记忆网络* 302
11.5.5 门限循环单元* 304
11.6 强化学习* 305
11.6.1 什么是强化学习？ 305
11.6.2 强化学习的不同的环境 307
11.6.3 强化学习的几个有代表性的算法及理论基础 307
11.6.4 强化学习的相关应用 308
11.6.5 强化学习的平台 308
11.6.6 强化学习的展望 309
11.7 深度学习在人工智能中的应用 309
11.7.1 深度学习在无人驾驶汽车领域的应用 309
11.7.2 深度学习在自然语言处理领域的应用 311
11.7.3 深度学习在医疗健康领域的应用 314
习题11 315
第12章案例分析 316
12.1 金融数据分析案例 316
12.2 高维稀疏单细胞RNA测序数据的聚类研究 321
12.2.1 背景介绍 321
12.2.2 研究目标和内容 322
12.2.3 数据标准化 323
12.2.4 基于隐变量标准化两阶段单细胞无监督类 325
12.3 手写数字识别 327
12.3.1 MNIST数据的说明和导入 327
12.3.2 MNIST手写数字神经网络识别 330
参考文献 337
附录A R语言简介 344
A.1 特点 344
A.2 安装和运行 344
A.3 帮助命令和帮助工具 345
A.4 RStudio 346
A.5 R编程要点 347
附录B Python语言介绍 356
B.1 基础介绍 356
B.2 非基础部分 367
B.3 机器学习常用module介绍 375
索引 379
彩图

用户名：	匿名用户
E-mail：
咨询内容：

相同语种的商品

销售排行榜

浏览历史

相同系列 全选

内容介绍 样章试读 用户评论 全部咨询

内容介绍

样章试读

用户评论

全部咨询

全部咨询(共0条问答)

目录

相同系列

全选

内容介绍

样章试读

用户评论

全部咨询