随着各种高通量微阵列技术的飞速发展,基于基因表达谱数据的分析已经成为系统生物学研究中的一个非常重要的领域。基因表达谱数据的最大特点是高噪声、高维数和小样本,针对这种数据的特点,本书主要介绍了基因调控网络的建模方法及其动态行为分析、分类器的设计及其误差估计、数据和特征的正则化,以及聚类算法及其验证过程等内容。
本书主要面向具有一定数学基础的生物信息学、计算生物学或系统生物学等领域的研究生或科研人员,也可以作为研究基因组学的教科书或参考书。
样章试读
目录
- 译者序
前言
第1章 生物基础
1.1 遗传学
1.1.1 核酸结构
1.1.2 基因
1.1.3 RNA
1.1.4 转录
1.1.5 蛋白质
1.1.6 翻译
1.1.7 转录调控
1.2 基因组学
1.2.1 微阵列技术
1.3 蛋白质组学
第2章 基因网络的确定性模型
2.1 图模型
2.2 布尔网络
2.2.1 细胞分化和细胞的功能状态
2.2.2 网络特性及动态行为
2.2.3 网络推理
2.3 布尔网络的推广
2.3.1 异步
2.3.2 多值网络
2.4 微分方程模型
2.4.1 有转录和翻译过程的微分方程模型
2.4.2 连续微分方程模型的离散化
第3章 基因网络的随机模型
3.1 贝叶斯网络
3.2 概率布尔网络
3.2.1 定义
3.2.2 推理
3.2.3 PBN的动力学
3.2.5 PBN与贝叶斯网络的关系
3.2.6 基于种子基因的子网络的生长
3.3 干预
3.3.1 基因干预
3.3.2 结构干预
3.3.3 外部控制
第4章 分类
4.1 贝叶斯分类器
4.2 分类规则
4.2.1 一致分类器设计
4.2.2 分类规则实例
4.3 有约束的分类器
4.3.1 分散系数
4.3.2 VC维数
4.4 线性分类
4.4.1 Rosenblatt感知器
4.4.2 线性及二次判别分析
4.4.3 基于最小二乘误差的线性判别式
4.4.4 支持向量机
4.4.5 线性判别式的设计误差的表示
4.4.6 基于样本QDA判别式的分布
4.5 神经网络分类器
4.6 分类树
4.6.1 分类与回归树
4.6.2 基于数据划分的强一致规则
4.7 误差估计
4.7.1 重代入法
4.7.2 交叉验证
4.7.3 自举法
4.7.4 支撑
4.7.5 误差估计器性能
4.7.6 特征集排序
4.8 误差校正
4.9 鲁棒分类器
4.9.1 最优鲁棒分类器
4.9.2 鲁棒分类器的性能比较
第5章 正则化
5.1 数据正则化
5.1.1 正则化判别分析
5.1.2 噪声注入
5.2 复杂度正则化
5.2.1 误差正则化
5.2.2 结构风险最小化
5.2.3 经验复杂度
5.3 特征选择
5.3.1 峰值现象
5.3.2 特征选择算法
5.3.3 误差估计对特征选择的影响
5.3.4 冗余
5.3.5 并行增量特征选择
5.3.6 贝叶斯变量选择
5.4 特征提取
第6章 聚类
6.1 聚类算法的实例
6.1.1 欧氏距离聚类
6.1.2 自组织映射
6.1.3 分层聚类
6.1.4 基于模型的聚类算子
6.2 聚类算子
6.2.1 算法结构
6.2.2 标记算子
6.2.3 贝叶斯聚类器
6.2.4 聚类算子的分布测试
6.3 聚类的验证
6.3.1 外部验证
6.3.2 内部验证
6.3.3 不稳定指数
6.3.4 贝叶斯因子
6.4 聚类算子学习
6.4.1 经验误差聚类算子
6.4.2 最近邻聚类规则
索引