本书论述了农业领域信息的专题语义获取技术,共包含四部分内容。第一部分(第1~6章)从技术角度描述如何构建农业信息专用搜索引擎;第二部分(第7、8章)介绍本体理论与知识获取;在此基础上,第三部分(第9~13章)以蔬菜供应链为例,从技术角度提出了实现知识管理和知识语义获取的系统框架;第四部分(第14~18章)以鱼病诊断为例,提出了能够指导基于案例的鱼病诊断的智能案例获取和推理方法。
本书可供信息主管、知识主管、企业及政府管理人员、知识管理系统软件设计开发人员参考阅读,也可作为高等院校知识管理、企业管理和计算机软件等专业研究生与本科生的参考教材。
样章试读
目录
- 前言
第一部分 农业信息垂直搜索引擎
第1章 国内外农业信息搜索引擎现状
1.1 国内外农业相关的信息搜索引擎
1.2 相关农业信息搜索引擎的对比
1.3 面向主题的专用搜索引擎系统核心技术研究
1.4 服务于电子商务的搜索引擎在专业领域的应用
1.5 价格搜寻理论
1.6 农业信息搜索引擎开发目标与技术路线
1.7 本章小结
第2章 垂直搜索引擎的基本原理与技术
2.1 垂直搜索引擎系统架构特点
2.2 垂直搜索引擎开发关键技术
2.2.1 主题型网页数据采集技术
2.2.2 专业领域信息抽取技术
2.2.3 大规模文件索引技术
2.2.4 检索个性化服务技术
2.3 检索质量评估标准
2.4 本章小结
第3章 农业信息主题网页采集技术
3.1 农业信息主题网页的特点分析
3.1.1 农业交易信息来源
3.1.2 农业交易信息分类
3.1.3 农产品电子交易信息搜寻成本
3.2 数据采集与更新模型
3.2.1 网页时效性问题
3.2.2 数据更新频率
3.2.3 队列排序
3.2.4 区域负责机制
3.3 性能测试与评估
3.3.1 测试环境
3.3.2 实验结果
3.4 本章小结
第4章 时空属性信息过滤与抽取技术
4.1 农业信息数据特点分析
4.1.1 农产品交易信息网页
4.1.2 交易数据的时间与空间属性
4.2 特定结构化信息过滤与抽取模型
4.2.1 网页信息表示
4.2.2 包装器定义
4.2.3 K-EA算法设计
4.3 性能测试与评估
4.3.1 评价指标
4.3.2 试验结果
4.4 本章小结
第5章 大规模文件索引技术
5.1 全文索引结构
5.1.1 位图
5.1.2 署名文件
5.1.3 倒排文件
5.1.4 后缀数组
5.2 双字节倒排中文索引模型
5.2.1 双字节倒排
5.2.2 虚拟内存硬盘缓存
5.3 性能测试与评估
5.3.1 评价指标
5.3.2 实验结果
5.4 本章小结
第6章 面向垂直搜索引擎的个性化检索服务技术
6.1 检索结果自动分类
6.1.1 农产品概念与分类问题
6.1.2 分类算法选择
6.1.3 K-近邻算法应用与改进
6.1.4 性能测试与评估
6.2 查询自动纠错
6.2.1 拼写错误问题
6.2.2 纠错原理与算法设计
6.2.3 性能测试与评估
6.3 本章小结
第二部分 本体论和知识获取
第7章 本体理论
7.1 本体的概念与内涵
7.2 本体的构建
7.3 本体表示语言
7.4 领域本体构建研究
7.5 本体自动获取相关理论
7.5.1 本体获取
7.5.2 本体获取分类
7.5.3 本体自动获取技术
7.6 本体学习
7.6.1 本体学习系统
7.6.2 本体学习基本原理与架构
7.6.3 本体学习系统结构
7.6.4 本体学习基本方法
7.7 本章小结
第8章 知识获取
8.1 知识获取方法
8.2 知识搜索推理方法
8.3 本章小结
第三部分 基于本体论的蔬菜供应链知识获取系统
第9章 蔬菜供应链
9.1 蔬菜供应链发展现状
9.1.1 发展现状
9.1.2 现状分析
9.2 蔬菜供应链知识获取系统构建框架
9.2.1 构建目标
9.2.2 技术路线
第10章 蔬菜供应链本体构建及形式化表示
10.1 蔬菜供应链及蔬菜供应链知识本体模型
10.1.1 我国蔬菜领域供应链模式
10.1.2 蔬菜供应链本体模型
10.1.3 蔬菜供应链知识本体模型
10.1.4 蔬菜供应链知识用户本体模型
10.1.5 知识、知识用户与知识背景本体间的关系
10.2 领域本体的形式化表示
10.2.1 RDF(S)形式化表示
10.2.2 Voronoi图的形式化表示
10.3 本章小结
第11章 领域概念的获取推理方法
11.1 基于本体形式化表示的领域概念获取
11.1.1 RDF(S)下的定性推理
11.1.2 Voronoi图下的定量推理
11.1.3 Voronoi实验测评
11.2 基于模糊推理的领域概念获取
11.2.1 模糊推理
11.2.2 NSM推理方法
11.2.3 改进的NSM推理算法
11.2.4 实验测评
11.3 基于WordNet的领域概念获取
11.3.1 同位关系与上下位关系
11.3.2 WordNet
11.3.3 局部线性嵌入领域概念提取算法
11.3.4 实验测评
11.4 本章小结
第12章 基于统计策略的文本搜索算法
12.1 统计语言建模
12.2 查询似然检索模型
12.2.1 投掷骰子的问题
12.2.2 基于查询似然的检索模型
12.2.3 数据平滑技术
12.3 查询似然检索模型在蔬菜供应链知识获取中的应用
12.4 本章小结
第13章 蔬菜供应链知识获取系统设计与实现
13.1 系统总体框架
13.2 系统开发工具与开发环境
13.2.1 Java和JDK
13.2.2 Eclipse
13.2.3 Tomcat
13.2.4 Protégé
13.2.5 Jena
13.3 系统模块设计
13.3.1 关键词检索
13.3.2 语义扩展检索
13.3.3 基于本体的语义检索
13.4 实验与结果分析
13.4.1 系统实现
13.4.2 结果分析
13.5 本章小结
第四部分 基于本体的鱼病诊断案例知识获取
第14章 鱼病知识诊断与案例知识获取
14.1 鱼病知识诊断
14.2 CBR
14.3 机器学习方法与知识科学技术
14.4 鱼病诊断知识获取框架
第15章 基于本体的诊断案例知识表示
15.1 CBR方法
15.1.1 CBR系统
15.1.2 案例诊断系统中的案例知识获取
15.1.3 案例知识存在形式及源案例
15.2 诊断案例知识获取
15.2.1 诊断案例知识表示
15.2.2 诊断案例从非结构化到结构化的映射
15.3 诊断案例知识面向对象表示
15.4 案例知识及其语义
15.4.1 知识与语义
15.4.2 诊断案例知识语义定义及其语义层次模型
15.5 本体与语义
15.5.1 语义与本体的关系
15.5.2 本体在知识系统中的作用
15.5.3 VSM及其语义化改进
15.5.4 非结构化、半结构化和结构化诊断案例知识的语义特征向量空间表示
15.6 诊断案例知识相似性度量
15.6.1 案例知识相似性关系的种类
15.6.2 传统案例相似性度量方法
15.6.3 基于面向对象模型的案例相似度计算
15.6.4 基于VSM的案例知识相似度比较
15.7 本章小结
第16章 鱼病诊断知识本体论
16.1 鱼病诊断知识本体模型
16.1.1 一般本体模型
16.1.2 鱼病诊断知识本体元数据定义
16.1.3 鱼病诊断本体元关系定义
16.1.4 鱼病诊断知识本体模型
16.1.5 鱼病诊断知识本体建模思想
16.2 鱼病诊断知识核心本体构建
16.2.1 核心诊断本体建模步骤与方法
16.2.2 基于OWL的鱼病诊断本体形式化模型
16.3 本章小结
第17章 诊断本体概念学习
17.1 基于关系模式和种子概念的鱼病诊断知识本体学习系统
17.1.1 基于关系模式的本体概念学习规则
17.1.2 基于种子概念面向文本的本体学习系统
17.1.3 实验分析和验证
17.2 本章小结
第18章 基于向量中心距离和K-近邻算法的案例知识自动获取
18.1 复杂案例知识获取系统框架
18.1.1 诊断案例知识的特点
18.1.2 诊断案例知识获取系统框架
18.2 非结构化、半结构化诊断案例预处理及语义特征向量提取
18.2.1 诊断案例知识源文本化
18.2.2 非结构化诊断案例知识语义特征向量提取
18.2.3 案例特征向量约减——特征抽取技术
18.3 结构化案例知识的语义VSM构建
18.4 诊断案例知识库结构与案例知识组织
18.4.1 诊断案例知识结构
18.4.2 诊断案例知识库的组织
18.5 基于语义特征向量模型的诊断案例检索策略
18.5.1 基于语义特征向量模型的诊断案例知识检索思想
18.5.2 基于中心向量距离的非结构化、半结构化新案例知识学习算法
18.6 基于语义向量模型的非结构化诊断案例多类分类
18.6.1 分类模型
18.6.2 案例相似度计算
18.6.3 K-近邻算法文本分类器
18.6.4 实验结果与分析
18.7 本章小结
参考文献
附录
附录A 互联网在中国蔬菜供应链中应用情况调查问卷
附录B 中华人民共和国国家标准物流术语