人的智能和AI赋能的机器智能在自动化控制领域的共融共存形成了“人机混合智能系统”这一新型的系统形式和智能形式。一方面,这类系统所代表的系统结构形式是传统自动化控制系统应对AI赋能的机器智能变革的必然发展形势;另一方面,它所代表的智能形式也成为AI未来发展的重要甚至是唯一的终极形式。在本书中,我们试图抛砖引玉,对这一全新而重要的研究领域提供初步但系统性的思考。全书共分10章,第1章首先讨论了人工智能时代人机系统的新发展,然后分别介绍人机混合智能系统的自主性基本理论(第I部分,包括第2~5章)和设计方法(第Ⅱ部分,包括第6~10章),涵盖了人机混合智能系统的自主性定义、边界判定、各种介入控制和共享控制方法等重要内容。
样章试读
目录
- 目录
前言
第1章 人工智能时代人机系统的新发展 1
1.1 面向自动化控制的人机系统 1
1.1.1 系统、机器和人 1
1.1.2 人机系统典型例子 3
1.1.3 研究人机系统的必要性 5
1.1.4 人机系统相关研究领域 6
1.2 人工智能时代的人机混合智能系统 8
1.2.1 人工智能技术的未来展望 8
1.2.2 弱人工智能与人机混合智能系统 11
1.2.3 人机混合智能系统的典型例子和场景 15
1.2.4 人机混合智能系统中人的位置 20
1.3 人机混合智能系统的研究挑战 21
1.3.1 作为关键核心的自主性 21
1.3.2 人机混合智能系统及其自主性的相关研究 22
1.3.3 人机混合智能系统研究面临的挑战 28
1.3.4 学术界和政府关注 29
1.4 本章小结 30
第I部分 人机混合智能系统自主性理论
第2章 人机混合智能系统基于空间和边界概念的自主性描述框架 33
2.1 人机混合智能系统的自主性及其边界 33
2.1.1 人机混合智能系统的智能与自主性的一般讨论 33
2.1.2 人机混合智能系统的自主性空间 36
2.1.3 人机混合智能系统的自主性边界 39
2.2 自主性空间和自主性边界的扩展 41
2.2.1 自主性绝对边界 42
2.2.2 自主性相对空间和相对边界 43
2.3 人与机器自主决策的联合形式表示 44
2.4 本章小结 45
第3章 人机混合智能系统基于自主性联合空间和联合边界的设计框架.46
3.1 人机混合智能系统的基本控制策略和设计框架 46
3.1.1 人机混合智能系统的基本控制策略:介入控制和共享控制 46
3.1.2 人机混合智能系统的基本设计框架:自主性联合空间和联合边界 49
3.2 人在环上:人机混合智能系统的介入控制 52
3.2.1 机器(单向)介入控制 52
3.2.2 人的(单向)介入控制 53
3.2.3 人机切换(双向介入)控制 54
3.3 人在环内:人机系统中人与机器的共享控制 56
3.3.1 基本共享控制 56
3.3.2 扩展共享控制 57
3.4 本章小结 58
第4章 自主性边界:深度学习不确定性的定量刻画 59
4.1 面向人机混合智能系统的深度学习不确定性的定量刻画 59
4.2 基于贝叶斯模型刻画深度学习不确定性的几种代表性方法 61
4.2.1 Probabilistic backpropagation方法 61
4.2.2 Bayes by backprop方法 63
4.2.3 MC dropout方法 65
4.3 模型不确定性在强化学习中的应用 66
4.3.1 通过量化模型不确定性促进深入探索 67
4.3.2 通过量化模型不确定性实现动态避障 68
4.4 本章小结 69
第5章 自主性边界:不同场景下的典型判定及应用 70
5.1 介入控制下的自主性边界典型判定及应用 70
5.1.1 机器介入人:利用自主性边界的判定优化机器对人的最小干预 70
5.1.2 人介入机器:利用自主性边界的判定优化强化学习算法 74
5.2 共享控制下的自主性边界典型判定及应用 77
5.2.1 共享控制中的自主性边界判定 77
5.2.2 基于仲裁机制的人机共享控制 79
5.2.3 利用自主性边界优化基于仲裁机制的人机共享控制 80
5.3 本章小结 82
第II部分 人机混合智能系统设计方法
第6章 人在环上:人的认知提升机器智能 85
6.1 利用人的认知特性提升机器学习算法性能的基本思想 85
6.2 利用人的认知心理模型提升机器智能 86
6.2.1 朴素贝叶斯算法介绍 87
6.2.2 利用人的认知特性的拉普拉斯平滑模型对朴素贝叶斯算法性能的提升 89
6.2.3 利用人的认知特性的松散对称模型对朴素贝叶斯算法性能的提升 91
6.2.4 引入松散对称模型提升基于拉普拉斯平滑的朴素贝叶斯算法的性能 94
6.3 利用人的生理认知特性提升机器智能 96
6.3.1 目标识别任务中人的生理认知特性测量 96
6.3.2 利用人脑视觉神经的活动特点改进支持向量机算法 97
6.4 本章小结 100
第7章 人在环上:人的介入增强AI系统可靠性 101
7.1 增强AI系统可靠性的必要性和重要性.101
7.1.1 对AI系统可靠性的要求 101
7.1.2 现有技术框架难以从本质上保证AI系统的可靠性 103
7.2 人的介入增强AI系统可靠性的思路和方法框架 104
7.2.1 人的介入增强AI系统可靠性的基本思路 104
7.2.2 人的介入增强AI系统可靠性的基本框架 105
7.3 人的介入提升珍珠分拣准确性 107
7.3.1 方法和实验设置 107
7.3.2 独立网络模型的搭建及训练.108
7.3.3 基于人的分歧介入方法的珍珠分拣实验结果 109
7.4 本章小结 109
第8章 人在环内:基于POMDP的共享自主 110
8.1 POMDP模型及其求解 110
8.1.1 POMDP模型表示 110
8.1.2 POMDP模型求解 112
8.2 基于POMDP的人机共享自主典型实例 113
8.2.1 利用POMDP实现汽车车道保持的共享自主 114
8.2.2 利用POMDP实现智能学习辅助系统的共享自主 116
8.3 过度信任和缺乏信任在基于POMDP的共享控制框架下的解释 118
8.4 本章小结 120
第9章 人在环内:基于强化学习的共享控制 121
9.1 强化学习和深度强化学习基本知识 121
9.1.1 强化学习基本知识 121
9.1.2 深度强化学习基本知识 124
9.2 基于强化学习的共享控制典型方法 127
9.2.1 基于DQN的无须先验知识的共享控制方法 127
9.2.2 基于SAC的无须预先训练的共享控制方法 129
9.2.3 基于AC的无须动态模型的共享控制方法 132
9.3 基于强化学习的共享控制实例 134
9.4 本章小结 136
第10章 人在环内:人机序贯决策的共享控制 138
10.1 序贯决策的基本概念.138
10.2 人机序贯决策问题的典型场景.141
10.2.1 “人参与问题”的人机序贯决策 141
10.2.2 “人介入方法”的人机序贯决策 142
10.3 基于POMDP方法求解“人参与问题”的人机序贯决策问题 143
10.3.1 “人参与问题”的人机序贯决策问题的POMDP框架概述 143
10.3.2 人机系统的POMDP框架实现驾驶辅助系统中的“车道保持” 145
10.4 基于MPC方法求解“人参与问题”的人机序贯决策问题 147
10.4.1 “人参与问题”的人机序贯决策问题的MPC框架概述 147
10.4.2 人机系统的MPC框架实现辅助驾驶系统中的“车辆变道” 148
10.5 基于RL方案求解“人介入方法”的人机序贯决策问题 150
10.5.1 “人介入方法”的人机序贯决策问题的RL框架概述 150
10.5.2 人机系统的RL框架实现倒立摆系统性能的提升 152
10.6 本章小结 154
参考文献 155
索引 167
插图目录 169
表格目录171
算法目录 172
定义列表 173
例子列表 174