本书是近年来作者对文本情感分类研究成果及经验的总结。本书针对文本情感分类中存在的高维数据、非均衡数据和无标签数据等问题,将泛化能力和适应性较强的集成学习引入文本情感分类问题的研究中,系统比较各类集成学习方法在文本情感分析中的有效性,以此为基础分别研究基于POS-RS的文本情感分类问题、基于非均衡数据分类的文本情感分类问题,以及基于半监督学习的文本情感分类问题。
样章试读
目录
- 目录
第1章 绪论 1
1.1 研究背景 1
1.2 国内外研究现状及发展动态分析 2
1.2.1 文本情感分类相关研究 2
1.2.2 集成学习相关研究 4
1.3 研究目标 5
1.4 研究内容 6
1.5 研究方法 7
1.6 本书结构 7
第2章 文本情感分类和机器学习理论研究 9
2.1 文本情感分类理论研究 9
2.1.1 文本情感分类概述 9
2.1.2 文本情感分类的主要任务 10
2.1.3 基于情感知识的方法 11
2.1.4 基于机器学习的方法 13
2.2 机器学习理论研究 18
2.2.1 机器学习概述 18
2.2.2 非均衡数据学习 26
2.2.3 半监督学习 31
第3章 集成学习在文本情感分类中的比较研究 39
3.1 概述 39
3.2 集成学习在情感分类中的应用 40
3.2.1 Bagging算法 40
3.2.2 Boosting算法 41
3.2.3 RS算法 42
3.3 实验设计 43
3.3.1 数据集 43
3.3.2 评价标准 43
3.3.3 实验过程 43
3.4 实验结果分析与讨论 44
3.4.1 实验结果 45
3.4.2 从集成学习方法角度进行的分析和讨论 58
3.4.3 从基学习器角度进行的分析和讨论 64
3.4.4 从特征集角度进行的分析和讨论 66
第4章 基于POS-RS的文本情感分类研究 69
4.1 概述 69
4.2 基于POS-RS的文本情感分类模型 70
4.2.1 特征选取 70
4.2.2 模型构建 72
4.2.3 POS-RS算法 73
4.3 实验设计 74
4.4 实验结果分析与讨论 75
4.4.1 实验结果 76
4.4.2 分析与讨论 76
第5章 电子商务中面向非均衡数据的文本情感分类研究 91
5.1 概述 91
5.2 基于词性分析和非均衡数据分类的文本情感分类方法 92
5.2.1 电子商务中基于词性分析的文本情感分类方法 92
5.2.2 电子商务中基于非均衡数据分类的文本情感分类方法 93
5.3 实验设计 96
5.3.1 实验数据集和评价指标 96
5.3.2 实验流程 97
5.4 实验结果分析与讨论 97
5.4.1 实验结果整体分析 100
5.4.2 不同非均衡数据分类方法对比分析 100
5.4.3 留词性和去词性方法对比分析 103
第6章 基于IDSSL的文本情感分类研究 105
6.1 概述 105
6.2 基于IDSSL的文本情感分类模型 107
6.2.1 基于分歧的半监督学习方法的文本情感分类建模 107
6.2.2 基于分歧的半监督学习方法的理论分析 108
6.2.3 基于IDSSL的文本情感分类方法 111
6.3 实验设计 113
6.3.1 实验数据集和评价指标 113
6.3.2 实验流程 113
6.4 实验结果分析与讨论 114
6.4.1 实验结果 114
6.4.2 分析与讨论 116
第7章 结论与展望 120
7.1 结论 120
7.2 展望 121
参考文献 123
彩图