本书共11章,系统地讲述信息处理与信息检索的相关知识。涉及的内容可分为四部分:第一部分为第1章和第11章,属于导论和结束语部分。第二部分为本书的第一个核心模块,重点介绍信息处理知识,涉及第2章、第3章和第4章。第三部分为本书的第二个核心模块,重点介绍信息检索知识,涉及章节为第5章~第8章。第四部分为信息处理与信息检索技术的实现与应用,涉及章节为第9章、第10章。本书内容组织合理、讲究实用性、选材得当,讲解深入浅出。从教学的角度而言,希望初学者通过本书的学习可以系统地掌握信息处理与信息检索的相关知识,了解其在现实中的应用;从科研的角度而言,希望初学者可以在学习基本理论的基础上,掌握信息检索的新发展,从中发现创新点,以提高信息检索系统的综合性能。
样章试读
目录
- 目录
第1章 导论 1
1.1 信息论 1
1.2 信息采集和信息源 5
1.3 信息处理概述 9
1.4 信息检索概述 11
1.5 信息处理与信息检索的关系 17
1.6 信息处理及信息检索发展的理论基础 18
第2章 检索对象信息处理 23
2.1 文本预处理 23
2.2 特征选择 30
2.3 特征抽取 38
2.4 信息的自动化处理 43
第3章 用户检索提问处理 56
3.1 检索词的选择 56
3.2 算符的使用 64
3.3 检索提问式生成实例 66
3.4 查询扩展技术 67
第4章 信息的存储与索引 74
4.1 信息存储 74
4.2 信息索引 78
4.3 索引构建 86
4.4 索引压缩 89
第5章 信息检索模型 100
5.1 布尔检索模型 100
5.2 向量空间检索模型 105
5.3 概率检索模型 112
5.4 三类信息检索模型的比较 126
第6章 常用的信息检索 130
6.1 文本检索 130
6.2 图像检索 139
6.3 多媒体检索 144
6.4 Web检索 146
6.5 电商检索 151
第7章 信息处理与信息检索的新发展 158
7.1 短文本 158
7.2 语义检索 162
7.3 社会化搜索 170
7.4 可视化检索 175
7.5 跨语言信息检索 182
第8章 信息检索的评价 190
8.1 评价概述 190
8.2 测试集合 191
8.3 效果评价 194
8.4 效率评价 199
8.5 用户效用 200
8.6 显著性检验 201
第9章 国内外重要的检索系统选介 204
9.1 万方数据库 204
9.2 中国博士学位论文全文数据库及中国优秀硕士学位论文全文数据库 205
9.3 中文社会科学引文索引 206
9.4 中国学术会议论文全文数据库 208
9.5 三大引文搜索——SCI、SSCI、A&HCI 209
9.6 ACM数据库 211
9.7 SpringerLink数据库 212
9.8 美国科学技术及社会科学会议索引 214
第10章 搜索引擎 216
10.1 搜索引擎概述 216
10.2 搜索引擎的基本原理 218
10.3 搜索引擎的优化 227
10.4 国内外搜索引擎选介 229
10.5 搜索引擎的未来发展趋势 235
第11章 信息检索存在的问题及展望 237
11.1 存在的问题 237
11.2 信息检索展望 241
参考文献 245