数据科学是一门新兴的交叉学科.数据科学人才需要同时具备理论性、实践性和应用性等多方面的素质.数据科学的知识点涵盖了编程语言、数学基础、数据清洗、数据可视化、数据分析和分布式计算等.为了帮助数据科学从业人员快速地查阅这些知识和工具的使用,提高实践效率,本书对数据科学的相关知识进行了归纳整理,形成数十份速查表.
样章试读
目录
- Contents
第一章编程语言 001
第一节Python 语言 002
第二节R 013
第三节SQL 023
第四节Git 027
第王节Shel1 031
第二章数据分析 041
第节NumPy 042
第二节Scipy Basics 045
第三节Pandas 050
第四节数据清洗 059
第五节StatsModels 063
第三章数学统计理论 068
第节概率 069
第二节统计 074
第三节矩阵微分 079
第四节线性代数 084
第五节图模型 091
第六节凸优化 095
第四章撤据可视化 106
第一节Matplotlib 107
第二节Seabom 111
第三节Basemap 115
第五章机器学习 119
第一节特征工程 120
第二节机器学习建模 125
第三节Scikit-learn 135
第四节PyTorch 141
第六章圄像处理 149
第一节基本概念 150
第二节像素的空间关系 151
第三节图像增强 152
第四节图像变换 156
第五节图像恢复 157
第六节图像分割 157
第七节图像编码 158
第七章分布式计算 159
第一节Haoop 160
第二节spark 166