机器学习的研究不仅是人工智能领域的核心问题,而且已成为近年来计算机科学与技术领域中最活跃的研究分支之一。
本书主要围绕基于神经网络的学习、强化学习和进化学习三个方面阐述机器学习理论、方法及其应用,共三部分13章。第一部分是神经网络学习及其在复杂非线性系统中的控制,包括基于时间差分的神经网络预测控制,基于径向基函数网络的机械手迭代学习控制,自适应T-S型模糊径向基函数网络等。第二部分是强化学习的大规模或连续空间表示问题,包括基于强化学习的自适应PID控制,基于动态回归网络的强化学习控制,基于自适应模糊径向基函数网络、支持向量机和高斯过程的连续空间强化学习,基于图上测地高斯基函数的策略迭代强化学习等。第三部分则是对分布估计优化算法进行研究,包括多目标优化问题的差分进化-分布估计算法,基于细菌觅食行为的分布估计算法在预测控制中的应用,一种多样性保持的分布估计算法及其在支持向量机参数选择问题中的应用等。为便于应用本书阐述的算法,书后附有部分机器学习算法MATLAB源程序。
本书可供理工科高等院校计算机科学、信息科学、人工智能和自动化技术及相关专业的教师及研究生阅读,也可供自然科学和工程技术领域中的研究人员参考。
样章试读
目录
- 《智能科学技术著作丛书》序
序
前言
第1章 机器学习概述
1.1 机器学习的概念
1.2 机器学习的发展历史
1.3 机器学习的分类
1.3.1 基于学习策略的分类
1.3.2 基于学习方法的分类
1.3.3 基于学习方式的分类
1.3.4 基于数据形式的分类
1.3.5 基于学习目标的分类
1.4 机器学习的主要策略
1.4.1 基于神经网络的学习
1.4.2 进化学习
1.4.3 强化学习
1.5 本书主要内容及安排
1.6 本章小结
参考文献
第2章 基于时间差分的神经网络预测控制
2.1 方法的提出
2.2 基于时间差分的Elman网络预测控制
2.2.1 Elman网络预测模型
2.2.2 反馈校正模型
2.2.3 参考轨迹
2.2.4 滚动优化算法
2.3 仿真研究
2.3.1 预测仿真
2.3.2 跟踪仿真
2.4 本章小结
参考文献
第3章 基于径向基函数网络的机械手迭代学习控制
3.1 机械手迭代学习控制
3.2 基于RBF网络的迭代学习控制
3.2.1 选取查询点的k个最接近样例
3.2.2 利用RBF网络拟合k个数据点
3.2.3 预测查询点的控制输入
3.3 仿真研究
3.4 本章小结
参考文献
第4章 自适应T-S型模糊径向基函数网络
4.1 RBF网络和模糊推理系统的功能等价性
4.2 自适应T-S型FRBF网络结构
4.3 自适应T-S型FRBF网络学习
4.3.1 网络学习动态
4..3.2 网络结构学习
4.3.3 网络参数学习
4.3.4 算法步骤
4.4 仿真研究
4.5 本章小结
参考文献
第5章 基于强化学习的自适应PID控制
5.1 Actor-Critic学习
5.2 基于强化学习的自适应PID控制
5.2.1 基于强化学习的自适应PID控制结构
5.2.2 基于RBF网络的Actor-Critic学习
5.3 控制器设计步骤
5.4 仿真研究
5.5 本章小结
参考文献
第6章 基于动态回归网络的强化学习控制
6.1 Q学习
6.2 基于Elman网络的强化学习控制
6.2.1 基于Elman网络的Q学习
6.2.2 Elman网络学习算法
6.2.3 基于Elman网络的Q学习方法步骤
6.3 仿真研究
6.4 本章小结
参考文献
第7章 基于自适应FRBF网络的强化学习
7.1 基于自适应FRBF网络的Actor-Critic学习
7.1.1 基于自适应FRBF网络的Actor-Critic学习结构
7.1.2 自适应FRBF网络的学习
7.1.3 算法步骤
7.1.4 仿真研究
7.2 基于自适应FRBF网络的Q学习
7.2.1 基于自适应FRBF网络的Q学习结构
7.2.2 自适应FRBF网络的学习
7.2.3 算法步骤
7.2.4 仿真研究
7.3 本章小结
参考文献
第8章 基于支持向量机的强化学习
8.1 SVM
8.1.1 机器学习
8.1.2 核学习
8.1.3 SVM的思想
8.1.4 SVM的重要概念
8.2 基于SVM的强化学习
8.2.1 基于SVM的Q学习结构
8.2.2 基于滚动时间窗机制的SVM
8.2.3 算法步骤
8.2.4 仿真研究
8.3 基于协同最小二乘SVM的强化学习
8.3.1 基于协同最小二乘SVM的Q学习
8.3.2 LS-SVRM逼近状态-动作对到值函数的映射关系
8.3.3 LS-SVCM逼近状态空间到动作空间的映射关系
8.3.4 仿真研究
8.4 本章小结
参考文献
第9章 基于高斯过程分类器的强化学习
9.1 基于高斯过程分类器的强化学习
9.2 在线高斯过程分类器学习
9.3 算法步骤
9.4 仿真研究
9.5 本章小结
参考文献
第10章 基于图上测地高斯基函数的策略迭代强化学习
10.1 环境的图论描述
10.2 测地高斯基函数
10.3 递归最小二乘策略迭代
10.4 算法步骤
10.5 仿真研究
10.6 本章小结
参考文献
第11章 多目标优化问题的差分进化-分布估计算法
11.1 多目标优化
11.2 多目标优化的差分进化-分布估计算法
11.2.1 多目标优化的DE-EDA混合算法步骤
11.2.2 多目标优化的DE子代生成策略
11.2.3 多目标优化的EDA子代生成策略
11.3 实例研究
11.4 本章小结
参考文献
第12章 基于细菌觅食行为的分布估计算法在预测控制中的应用
12.1 方法的提出
12.2 基于改进分布估计算法的预测控制
12.2.1 预测模型
12.2.2 反馈校正模型
12.2.3 基于改进分布估计算法的滚动优化
12.3 实验分析
12.3.1 Benchmark函数实验
12.3.2 预测控制的曲线跟踪实验
12.4 本章小结
参考文献
第13章 一种多样性保持的分布估计算法
13.1 混沌模型
13.2 多样性保持分布估计算法
13.3 Benchmark函数实验
13.4 在支持向量机参数选择中的应用
13.4.1 算法步骤
13.4.2 Chebyshev混沌时间序列预测
13.5 本章小结
参考文献
附录 部分机器学习算法MATLAB源程序
程序1 第11章多目标差分进化-分布估计算法MATLAB源程序
程序2 第12章基于细菌觅食行为的分布估计算法部分MATLAB源程序
程序3 第13章一种多样性保持的分布估计算法部分MATLAB程序