Hadoop/Spark大数据机器学习_计算机理论_信息技术_图书分类

当前位置: 图书分类 > 信息技术 > 计算机理论 > Hadoop/Spark大数据机器学习

相同作者的商品

面向数据挖掘的算法设计与分析
售价：￥71.10元

相同语种的商品

SAS软件实用教程（第二版）
售价：￥37.92元

基因组学方法
售价：￥47.24元

线性代数
售价：￥30.02元

蛋白质纯化指南（原书第二版）
售价：￥144.00元

精编蛋白质科学实验指南
售价：￥195.92元

企业管理信息系统
售价：￥29.23元

生态学考研精解
售价：￥27.65元

真空镀膜原理与技术
售价：￥43.45元

大学文科数学
售价：￥39.20元

对现代规范伦理学的颠破
售价：￥46.61元

相同系列

全选

面向数据挖掘的算...
￥71.10元
Hadoop/S...
￥101.12元
机电设备系统安装...
￥14.22元
闽南—台湾浅滩渔...
￥43.45元
工程制图（含习题...
￥37.92元
会计学
￥26.07元
SAS软件实用教...
￥37.92元
政策可持续发展评...
￥37.92元
一九七八年中国天...
￥4.74元
数据库技术与应用
￥21.33元
稀土发光材料——...
￥142.20元
C语言程序设计基...
￥22.12元
解析几何
￥11.85元
PowerBui...
￥20.54元
地理信息系统——...
￥62.41元
黃河中游西部地区...
￥0.95元
中国的民族
￥276.50元
妇产科护理学笔记
￥18.96元
基因组学方法
￥47.24元
PIC单片机BA...
￥37.92元
亚洲中部山地夷平...
￥14.22元
生活逻辑与主题学...
￥41.08元
陆地卫星假彩色影...
￥0.00元
寻找新药中的组合...
￥48.00元
大学计算机基础实...
￥30.02元
清代中央决策机制...
￥37.92元
钱三强论文选集
￥0.00元
地球系统研究与科...
￥118.50元
中国第三届MBA...
￥51.35元
中国植物志第五...
￥1.58元
电磁工程
￥37.92元
中国兜兰属植物
￥221.20元
钢-混凝土组合梁...
￥38.71元
经典力学
￥1.74元
口腔组织病理学（...
￥19.75元
机械制图习题集
￥16.59元
精密工程测量
￥38.71元
倪珠英中医儿科心...
￥61.62元
生物能源（导读版...
￥101.12元
现代社交心理学
￥12.64元
中国植物志第4...
￥37.92元
细胞工程
￥47.24元
Intranet...
￥25.28元
抢救上班族英语-...
￥30.81元
医学细胞生物学笔...
￥33.18元
大学物理实验报告...
￥13.27元
综合自然地理学
￥30.81元
计算机辅助设计技...
￥19.75元
叶肢介化石
￥2.41元
有线电视工程设计...
￥17.38元

内容介绍

样章试读

用户评论

全部咨询

人类已进入大数据时代。大数据是指具有海量（volume）、多模态（variety）、变化速度快（velocity）、蕴含价值高（value）和不精确性高（veracity）“5V”特征的数据。大数据给传统的机器学习带来巨大的挑战，已引起学术界和工业界的高度关注。Hadoop和Spark正是在这种背景下产生的两个大数据开源平台。本书重点介绍基于这两种大数据开源平台的机器学习，包括机器学习概述、大数据与大数据处理系统、Hadoop分布式文件系统HDFS、Hadoop并行编程框架MapReduce、Hadoop大数据机器学习和Spark大数据机器学习。

样章试读

暂时还没有任何用户评论

总计 0 个记录，共 1 页。第一页上一页下一页最末页

全部咨询(共0条问答)

暂时还没有任何用户咨询内容

总计 0 个记录，共 1 页。第一页上一页下一页最末页

用户名：匿名用户

E-mail：

咨询内容：

目录
前言
第1章机器学习概述 1
1.1 分类与聚类 1
1.1.1 分类 1
1.1.2 聚类 4
1.2 K-近邻算法与模糊K-近邻算法 7
1.2.1 K-近邻算法 7
1.2.2 模糊K-近邻算法 8
1.3 K-均值算法与模糊K-均值算法 10
1.3.1 K-均值算法 10
1.3.2 模糊K-均值算法 12
1.4 决策树算法 13
1.4.1 离散值决策树算法 13
1.4.2 连续值决策树算法 25
1.5 神经网络 31
1.5.1 神经元模型 32
1.5.2 梯度下降算法 33
1.5.3 多层感知器模型 35
1.6 极限学习机 40
1.7 支持向量机 42
1.7.1 线性可分支持向量机 42
1.7.2 近似线性可分支持向量机 46
1.7.3 线性不可分支持向量机 47
1.8 主动学习 49
第2章大数据与大数据处理系统 53
2.1 大数据及其特征 53
2.2 Linux操作系统简介 54
2.2.1 Linux版本 54
2.2.2 Linux的文件与目录 56
2.2.3 Linux用户与用户组 62
2.2.4 Linux系统软件包管理 65
2.2.5 Linux操作系统的安装 66
2.3 大数据处理系统Hadoop 79
2.3.1 什么是Hadoop 79
2.3.2 Hadoop的特性 82
2.3.3 Hadoop的体系结构 82
2.3.4 Hadoop的运行机制 83
2.3.5 Hadoop 1.0和Hadoop 2.0的区别 85
2.3.6 Hadoop的安装及大数据处理环境的架构 87
2.4 大数据处理系统Spark 95
2.4.1 什么是Spark 95
2.4.2 Spark的运行架构 96
2.4.3 Spark的工作机制 97
第3章 Hadoop分布式文件系统HDFS 106
3.1 HDFS概述 106
3.1.1 HDFS的优势 106
3.1.2 HDFS的局限性 107
3.2 HDFS的系统结构 107
3.3 HDFS的数据存储 111
3.3.1 数据块的存放策略 111
3.3.2 数据的读取策略 112
3.3.3 文件系统元数据的持久性 114
3.3.4 HDFS的鲁棒性 114
3.4 访问HDFS 116
3.4.1 通过文件系统Shell访问HDFS 116
3.4.2 通过文件系统Java API访问HDFS 120
3.5 HDFS读写数据的过程 132
3.5.1 HDFS读数据的过程 132
3.5.2 HDFS写数据的过程 133
第4章 Hadoop并行编程框架MapReduce 135
4.1 MapReduce概述 135
4.2 MapReduce的大数据处理过程 136
4.2.1 Map阶段 137
4.2.2 Shu2e阶段 138
4.2.3 Reduce阶段 140
4.3 一个例子:流量统计 141
4.4 MapReduce的系统结构 144
4.5 MapReduce的作业处理过程 146
4.6 MapReduce算法设计 147
4.6.1 大数据决策树算法设计 147
4.6.2 大数据极限学习机算法设计 150
第5章 Hadoop大数据机器学习 152
5.1 基于Hadoop的大数据K-近邻算法 155
5.1.1 大数据K-近邻算法的基本思想 155
5.1.2 大数据K-近邻算法的MapReduce编程实现 156
5.2 基于Hadoop的大数据极限学习机 170
5.2.1 大数据极限学习机的基本思想 170
5.2.2 大数据极限学习机的MapReduce编程实现 170
5.3 基于Hadoop的大数据主动学习 191
5.3.1 大数据主动学习的基本思想 191
5.3.2 大数据主动学习的MapReduce编程实现 192
第6章 Spark大数据机器学习 201
6.1 SparkMLlib 201
6.1.1 MLlib决策树算法 201
6.1.2 MLlib决策森林算法 204
6.1.3 MLlib K-means算法 207
6.1.4 主成分分析 210
6.2 基于Spark的大数据K-近邻算法 212
6.3 基于Spark的大数据主动学习 218
参考文献 238

联系编辑

标题：

内容：

联系方式：

相同作者的商品

相同语种的商品

销售排行榜

浏览历史

相同系列

全选

内容介绍

样章试读

用户评论

全部咨询

内容介绍

样章试读

用户评论

全部咨询

全部咨询(共0条问答)

目录

用户名：	匿名用户
E-mail：
咨询内容：

相同作者的商品

相同语种的商品

销售排行榜

浏览历史

相同系列 全选

内容介绍 样章试读 用户评论 全部咨询

内容介绍

样章试读

用户评论

全部咨询

全部咨询(共0条问答)

目录

相同系列

全选

内容介绍

样章试读

用户评论

全部咨询