面对海量信息,信息的精确检索就像大海捞针一样困难。智能检索技术吸取多个学科的研究成果,力图通过对文本、图像和视频信息的智能处理,实现信息的精确检索。本书系统地阐述了文本、图像和视频检索的理论方法和实现技术,并重点突出了本领域的最新研究成果。
本书可作为高等院校计算机科学与技术、模式识别与智能系统等学科方向高年级本科生和研究生的教材,也可作为相关领域学生的参考书。
样章试读
目录
- 《智能科学技术著作丛书》序
前言
第1章 文本检索技术
1.1 基于索引的检索技术
1.2 文本提取
1.3 文本预处理
1.3.1 停用词删除
1.3.2 词干提取
1.3.3 索引词选择
1.3.4 建立词典
1.4 索引
1.5 文本检索模型
1.5.1 布尔模型
1.5.2 向量空间模型
1.5.3 概率论模型
1.5.4 PageRank模型
1.6 分布式搜索引擎
1.6.1 分布式元搜索引擎
1.6.2 散列式分布搜索引擎
1.6.3 局部遍历型搜索引擎
1.6.4 P2P分布式搜索引擎
第1章参考文献
第2章 文本自动分词
2.1 基于字符串匹配的正向最大匹配算法
2.2 基于简码匹配的Hash分词算法
2.2.1 简码匹配方式
2.2.2 Hash分词算法
2.2.3 消歧融入切分过程
2.2.4 基于简码的Hash算法
2.2.5 平均匹配次数的理论分析
2.2.6 分词测试及结果
2.3 基于统计的分词方法
第2章参考文献
第3章 概念语义空间
3.1 基于奇异值分解的潜在语义索引方法
3.2 基于非负矩阵分解的潜在语义索引方法
3.2.1 NMF问题的提出
3.2.2 目标函数
3.2.3 NMF方法的迭代规则
3.2.4 NMF的非唯一性
3.2.5 基于NMF的概念语义生成
3.2.6 其他NMF方法
3.3 NMF方法与SVD方法的比较
3.3.1 问题本质
3.3.2 概念语义向量的特点
3.3.3 概念语义向量的解释
3.3.4 NMF方法与SVD方法敏感性的比较
3.3.5 NMF方法与SVD方法检索性能的比较
第3章参考文献
第4章 基于本体的文本检索技术
4.1 本体定义
4.2 描述逻辑
4.2.1 描述逻辑ALC
4.2.2 描述逻辑ALC的构造子扩展
4.3 本体语言
4.3.1 可扩展标记语言XML
4.3.2 资源描述框架RDF
4.3.3 本体语言OWL
4.4 基于本体的文本检索技术
4.4.1 本体构建
4.4.2 语义标注
4.4.3 语义查询
第4章参考文献
第5章 基于内容的图像检索
5.1 基于内容的图像检索的原因
5.2 基于内容的图像检索概述
5.2.1 基于视觉特征的图像检索
5.2.2 基于对象类型的图像检索
5.2.3 基于抽象属性的图像检索
5.3 Web图像检索
第5章考文献
第6章 MPEG-7标准中图像的视觉特征
6.1 图像的颜色特征
6.1.1 颜色空间
6.1.2 颜色量化
6.1.3 主颜色
6.1.4 可伸缩颜色
6.1.5 颜色布局
6.1.6 颜色结构
6.2 图像的纹理特征
6.2.1 同质纹理
6.2.2 纹理浏览
6.2.3 边缘直方图
6.3 图像的形状特征
6.3.1 基于区域的形状
6.3.2 基于轮廓的形状
第6章参考文献
第7章 图像的局部特征
7.1 图像兴趣点和兴趣区域的发现器
7.1.1 Harris兴趣点发现器
7.1.2 Harris-Laplace兴趣区域发现器
7.1.3 Hessian-Laplace兴趣区域发现器
7.1.4 高斯差分金字塔
7.2 尺度不变特征变换SIFT
7.2.1 SIFT特征的提取
7.2.2 SIFT兴趣点的匹配
7.2.3 与SIFT有关的其他局部特征
7.3 方向可调滤波器
7.4 形状上下文
7.5 矩不变量
第7章参考文献
第8章 基于视觉特征的图像检索技术
8.1 图像分割技术
8.1.1 图像分割概念
8.1.2 图像分割算法
8.1.3 分割方法存在的问题
8.2 相似性度量
8.2.1 几何模型
8.2.2 相关计算模型
8.2.3 关联系数模型
8.3 索引
8.3.1 高维索引方法
8.3.2 降维方法
8.3.3 近似最近邻方法
8.3.4 单一维空间映射方法
8.3.5 多重空间填充曲线方法
8.3.6 基于过滤的方法
8.4 相关反馈技术
8.5 图像检索系统性能的评价准则
8.6 基于视觉特征的图像检索系统
第8章参考文献
第9章 基于语义的图像检索技术
9.1 图像标注技术的概况
9.2 图像标注系统的工作原理
9.3 基于MPEG-7的图像标注技术
9.3.1 SVM分类器
9.3.2 基于MPEG-7的图像标注技术
9.4 基于特征选择的图像标注技术
9.4.1 遗传算法的基本思想
9.4.2 基于二进制编码遗传算法的最优特征子集选择方法
9.4.3 基于双编码遗传算法的最优加权特征子集选择方法
9.4.4 基于特征选择的图像标注技术
9.5 基于Adaboost算法的图像标注技术
9.5.1 Adaboost算法
9.5.2 k-NN分类器
9.5.3 主从式并行遗传算法的实现
9.5.4 图像标注技术
9.6 基于类对特征选择的图像标注技术
9.7 实验结果
9.8 大规模图像的标注技术
9.8.1 WordNet简介
9.8.2 基于WordNet的图像标注技术
9.8.3 小结
第9章参考文献
第10章 Web图像的检索技术
10.1 Web图像搜索引擎的工作原理
10.2 Web图像的抓取
10.3 网页文本信息的挖掘
10.3.1 网页上的文本信息源
10.3.2 标注精炼
10.4 图像排序
10.5 搜索结果重排
10.5.1 基于相关反馈的结果重排
10.5.2 基于PageRank的结果重排
第10章参考文献
第11章 基于内容的视频检索技术
11.1 基于内容的视频检索技术的基础
11.2 当前的基于内容的视频检索技术
11.3 存在的问题
第11章参考文献
第12章 视频的结构化技术
12.1 镜头的边界检测
12.1.1 非压缩域内镜头边界检测算法
12.1.2 压缩域内镜头边界检测算法
12.2 镜头关键帧的提取
12.3 视频的特征提取
12.4 视频结构化中的关键技术
第12章参考文献
第13章 语音识别技术
13.1 语音识别技术的发展历程
13.2 语音识别系统的工作原理
13.3 梅尔频率倒谱系数
13.3.1 语音信号预处理
13.3.2 离散Fourier变换
13.3.3 取能量
13.3.4 梅尔尺度滤波器组
13.3.5 取对数
13.3.6 离散余弦变换
13.3.7 梅尔频率倒谱系数
13.4 HMM模型
13.5 语言模型
第13章参考文献
第14章 视频的标注技术
14.1 视频的标注技术概述
14.2 特定领域内的视频标注技术
14.2.1 视频场景分析
14.2.2 视频精彩片段提取
14.2.3 视频事件检测
14.3 视频的多标签标注技术
14.3.1 独立概念标注技术
14.3.2 概念融合标注技术
14.3.3 同时发现概念和概念间相互关系的标注技术
14.4 主动学习方法在视频标注中的应用
第14章参考文献