电子商务推荐系统是解决信息超载的重要技术。协同过滤作为推荐系统中广泛使用的、最成功的推荐算法,还存在诸如稀疏性(sparsity)、冷启动(cold-start)、可扩展性(scalabilit5f)等制约其进一步发展的瓶颈问题。本书针对稀疏性问题,提出了非目标用户类型区分理论、领域最近邻理论、基于Rough集理论的用户评分项并集未评分值填补方法等;针对冷启动问题,提出了一种冷启动消除方法,包括用户访问项序理论、n序访问解析逻辑、改进的最频繁项提取算法IMIEA、用户访问项序的Markov链模型等;针对可扩展性问题,提出了适应用户兴趣变化的协同过滤增量更新机制;最后设计并实现了一个电子商务协同过滤原型系统ECRec。
样章试读
目录
- 目录
前言
第1章 绪论1
1.1问题的提出1
1.2研究目的与意义4
1.3电子商务推荐系统概述6
1.3.1定义及任务6
1.3.2用户偏好数据7
1.3.3相关推荐技术9
1.4国内外研究现状15
1.4.1协同过滤的起源和发展15
1.4.2协同过滤的瓶颈问题22
1.4.3稀疏性问题研究现状24
1.4.4可扩展性问题研究现状33
1.5研究内容与结构安排43
第2章 传统协同过滤及其评价方法45
2.1基于用户的协同过滤45
2.1.1表示46
2.1.2邻居用户形成46
2.1.3推荐生成49
2.2基于项目的协同过滤51
2.2.1邻居项目形成51
2.2.2推荐生成55
2.3推荐质量评价方法56
2.3.1评价标准56
2.3.2实验数据集59
2.3.3实验方案60
2.4本章小结60
第3章 面向KNN法的稀疏性缓解理论研究61
3.1相关工作分析61
3.2非目标用户类型区分理论62
3.3基于领域最近邻理论的KNN法64
3.3.1领域最近邻理论64
3.3.2基于领域最近邻的KNN法描述67
3.3.3实验结果及分析69
3.4基于Rough集理论的KNN法73
3.4.1基于Rough集理论的未评分项填补方法73
3.4.2基于Rough集理论的KNN法描述78
3.4.3实验结果及分析79
3.5本章小结87
第4章 基于用户访问项序的冷启动消除方法研究88
4.1相关工作分析88
4.2用户访问项序理论90
4.2.1用户访问项序的获取90
4.2.2n序访问解析逻辑93
4.2.3用户访问项序的相似性计算方法95
4.3基于访问项序最近邻的top-N推荐99
4.4基于Markov链模型的商品导航推荐101
4.4.1Markov链与概率转移矩阵101
4.4.2用户访问项序的Markov链模型104
4.4.3模型的训练方法105
4.5实验结果及分析106
4.5.1实验环境、数据集及评价标准106
4.5.2实验结果及分析107
4.6本章小结109
第5章 面向可扩展性的增量更新机制研究110
5.1相关工作分析110
5.2项目相似性增量更新机制111
5.2.1增量更新机制的基本思想112
5.2.2独立因子的增量值计算方法113
5.2.3计算复杂度分析118
5.2.4增量更新流程分析120
5.3实验结果及分析121
5.3.1实验环境、数据集及评价标准121
5.3.2实验结果及分析123
5.4本章小结125
第6章 电子商务协同过滤系统ECRec的设计与实现126
6.1ECRec的设计127
6.1.1系统架构设计127
6.1.2功能模块设计128
6.1.3系统内存处理设计132
6.2ECRec的实现136
6.3本章小结139
第7章 总结与展望140
7.1研究工作总结140
7.2未来研究展望142
参考文献144