本书利用当前最热门的社交网络媒体微博等进行大数据文本分析,并在此基础上,提出基于文本分析的推荐方法,多层级推荐方法,融合评分矩阵的推荐方法,基于社团聚类的推荐方法,基于用户点击行为的混合推荐方法,融合隐性特征的群组推荐方法,分布式群组推荐方法。同时给出一种Web查询词推荐服务,让用户更精确地查找并定位到所要搜索的相关网页。
样章试读
目录
- 目录
第1章 绪论 1
第2章 微博大数据分析与推荐方法 4
2.1 新浪微话题的媒体特征分析 4
2.1.1 微博活跃度 4
2.1.2 微话题的演变趋势 6
2.1.3 基于LDA的语义抽取 9
2.2 基于新鲜方面的Web查询词推荐服务 11
2.2.1 查询词推荐流程 11
2.2.2 查询词推荐算法 12
2.2.3 数据集的选取与数据评估方法 13
2.2.4 实验结果与分析 14
第3章 Web大数据多层级推荐方法 21
3.1 单层级相关推荐 21
3.1.1 相关推荐场景及基础算法分析 21
3.1.2 基于热度融合的相关推荐 24
3.1.3 实验结果与分析 32
3.2 多层级相关推荐 38
3.2.1 基于资源传播的相关推荐 38
3.2.2 基于用户反馈的多层级相关推荐 44
3.2.3 实验结果与分析 49
第4章 融合评分矩阵和评论文本的推荐方法 54
4.1 基于评分数据的矩阵分解模型 54
4.1.1 传统的评分矩阵分解模型 54
4.1.2 邻域影响的矩阵分解模型 56
4.1.3 传统模型实验结果分析 57
4.2 融合评分与评论的HFPT及DLMF算法 61
4.2.1 基于评论主题偏好的HFPT算法 62
4.2.2 融合用户偏好与商品特性的DLMF算法 69
4.2.3 实验结果与分析 76
第5章 基于社团聚类的推荐方法 83
5.1 社团结构以及社团发现算法 83
5.2 基于用户偏好聚类的社团发现算法 84
5.2.1 用户兴趣偏好建模 85
5.2.2 CDPC算法流程 85
5.3 基于社团聚类的兴趣偏好建模算法 88
5.3.1 CDCF算法的提出 88
5.3.2 CDCF算法流程 89
5.3.3 CDCF算法实验 90
5.4 社团聚类与多源数据融合建模的兴趣点推荐算法 92
5.4.1 SoGeoSco建模过程 93
5.4.2 社团聚类与多源数据融合建模的SoGeoSco模型 98
第6章 基于用户行为的混合推荐方法 105
6.1 基于加权的混合模型 105
6.1.1 基于SVD的矩阵分解模型 105
6.1.2 ListWise优化后的矩阵分解模型 107
6.1.3 基于用户的协同过滤模型 109
6.1.4 线性加权混合 110
6.2 基于Stacking的混合推荐 111
6.2.1 初级学习器选择 112
6.2.2 次级学习器选择 113
6.3 实验设计与结果分析 114
6.3.1 实验评价指标 114
6.3.2 数据集选取与处理 114
6.3.3 实验环境 117
6.3.4 实验设计与分析 117
6.3.5 实验结果对比 123
第7章 融合隐性特征的群组用户推荐方法 125
7.1 融合隐性特征的个人推荐算法 125
7.1.1 个人推荐的常用方法 125
7.1.2 SVD++推荐算法模型 128
7.2 融合隐性特征的群组推荐算法 131
7.2.1 群组推荐生成方式 131
7.2.2 群组融合策略 133
7.2.3 融合隐性特征的群组推荐算法 135
7.3 群组推荐实验分析 137
7.3.1 数据准备 137
7.3.2 融合隐性特征的个人推荐算法实验 139
7.3.3 融合隐性特征的群组推荐算法实验 144
第8章 分布式群组推荐方法 150
8.1 并行架构及算法描述 150
8.1.1 LUALS-WR算法描述 150
8.1.2 基于LU分解的特征向量更新 153
8.2 分布式矩阵分解模型求解 157
8.2.1 SGD和ALS 157
8.2.2 基于MapReduce的分割策略 160
8.2.3 实验结果与分析 161
8.3 Follow社交关系的群组推荐方法 165
8.3.1 群组推荐方法 166
8.3.2 偏好融合策略 168
8.4 实验结果与分析 172
8.4.1 实验数据预处理 172
8.4.2 实验方案设计 172
8.4.3 实验分析 173
参考文献 179