本书兼顾统计知识的基础性和系统性,系统介绍深度学习基础知识和建模技术。本书共包括7章,第1章介绍机器学习、人工智能和深度学习发展历程及相关概念;第2章介绍深度学习的理论知识,如张量、梯度、损失函数、激活函数、反向传播等;第3章介绍基础神经网络在二分类数据、多分类数据和连续数据上的实例构建;第4章介绍神经网络模型的泛化策略;第5章介绍卷积神经网络的模型结构及其在图像分类问题中的应用;第6章介绍循环神经网络的模型结构及其在序列数据中的应用;第7章介绍文本数据建模的全过程,并结合前几章介绍的模型结构和优化策略,基于案例展示用于处理自然语言的深度学习模型。
样章试读
目录
- 目录
第1章 深度学习入门 1
1.1 机器学习与深度学习 1
1.2 人工智能与深度学习 10
1.3 机器学习算法回顾 12
1.4 搭建深度学习环境 17
第2章 深度学习理论基础 26
2.1 张量 26
2.2 张量运算 30
2.3 导数和梯度 36
2.4 参数迭代估计算法 39
2.5 反向传播算法 44
2.6 损失函数 48
2.7 激活函数 52
2.8 mini-batch 58
2.9 神经网络拟合任意函数 60
第3章 基础神经网络 69
3.1 神经网络剖析 69
3.2 使用Keras开发一个模型:概览 72
3.3 电影评论分类:二分类问题 76
3.4 手写数字识别:多分类问题 86
3.5 预测房价:回归问题 92
第4章 神经网络模型的泛化策略 101
4.1 模型评价 101
4.2 权重参数正则化 104
4.3 Dropout 113
4.4 早停法 117
4.5 批标准化 120
第5章 卷积神经网络 122
5.1 卷积神经网络模型结构 122
5.2 在小型数据集上训练的二维卷积神经网络模型 138
5.3 通过预训练模型提高模型性能 152
5.4 具有代表性的卷积神经网络模型 166
第6章 循环神经网络 170
6.1 循环神经网络工作原理 171
6.2 数值型序列数据上的循环神经网络 182
6.3 复杂循环神经网络 197
第7章 用于文本数据的深度学习模型 206
7.1 文本数据预处理 206
7.2 基于卷积神经网络的文本数据分类模型 216
7.3 基于循环神经网络的文本数据分类模型 229
7.4 小结 238
参考文献 239