0去购物车结算
购物车中还没有商品,赶紧选购吧!
当前位置: 图书分类 > 信息技术 > 自动化 > 文本挖掘原理

相同语种的商品

浏览历史

文本挖掘原理


联系编辑
 
标题:
 
内容:
 
联系方式:
 
  
文本挖掘原理
  • 书号:9787030293060
    作者:程显毅,朱倩
  • 外文书名:
  • 装帧:平装
    开本:B5
  • 页数:228
    字数:273000
    语种:中文
  • 出版社:科学出版社
    出版时间:2010-11-29
  • 所属分类:
  • 定价: ¥70.00元
    售价: ¥70.00元
  • 图书介质:
    按需印刷

  • 购买数量: 件  可供
  • 商品总价:

相同系列
全选

内容介绍

样章试读

用户评论

全部咨询

  在信息时代,存储大量数据比较容易。通过Web、企业内部网、电传新闻获得的文本数量在急剧增加,这导致信息过载。然而,数据量虽然增加了,但可用的信息却在减少。文本挖掘是一个新的令人振奋的研究领域,其试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等技术来解决信息过载问题。
  文本挖掘包括文本集合的预处理(文本分类、信息抽取)、中间结果存储、中间结果分析技术(分布分析、聚类、趋势分析、关联规则抽取)和最终结果的可视化。它与关联分析类似,为人们提供了分析海量文本数据的新工具,并且通过学习模式来指导抽取实体关系。
  本书首先讨论了文本挖掘的总体结构以及文本挖掘预处理算法,然后深入地研究了文本挖掘核心操作,最后探讨真实世界中文本挖掘的主要应用和DIAL,弥补了理论和实践的脱节。
  本书主要可供对文本挖掘感兴趣的本科高年级学生、研究生、研究人员和专业开发人员参考,对从事文本挖掘开发和使用文本挖掘系统的人也会有很大帮助。
样章试读
  • 暂时还没有任何用户评论
总计 0 个记录,共 1 页。 第一页 上一页 下一页 最末页

全部咨询(共0条问答)

  • 暂时还没有任何用户咨询内容
总计 0 个记录,共 1 页。 第一页 上一页 下一页 最末页
用户名: 匿名用户
E-mail:
咨询内容:

目录

  • 前言
    第1章 文本挖掘概述
    1.1 文本挖掘的产生背景
    1.2 文本
    1.2.1 文本格式
    1.2.2 动态文本集
    1.3 文本挖掘的概念
    1.4 文本挖掘的任务
    1.4.1 文本挖掘预处理
    1.4.2 文本模式挖掘
    1.4.3 挖掘结果可视化
    1.5 文本挖掘系统的通用体系结构
    第2章 文本表示
    2.1 向量空间模型
    2.1.1 权值计算
    2.1.2 向量相似度度量
    2.2 概率模型
    2.3 概念模型
    2.3.1 概念
    2.3.2 概念词典
    2.3.3 概念距离
    2.3.4 概念相似度
    2.3.5 基于概念的文本表示模型的构建
    2.3.6 计算概念特征权值
    2.4 特征生成
    2.4.1 常用的文本特征
    2.4.2 各种特征比较
    2.4.3 特征维数
    2.4.4 领域知识和背景知识
    2.5 特征选择
    2.6 特征抽取
    2.6.1 潜在语义分析
    2.6.2 同义项合并
    第3章 文本挖掘预处理——文本分类
    3.1 文本分类的种类
    3.1.1 单标签分类与多标签分类
    3.1.2 文本主元与类别主元分类
    3.1.3 硬分类和软分类
    3.2 文本分类的应用
    3.2.1 文本索引
    3.2.2 文本过滤
    3.2.3 网页分类
    3.3 文本分类的知识工程方法
    3.4 文本分类的机器学习方法
    3.4.1 概率分类器
    3.4.2 贝叶斯回归分析
    3.4.3 决策树分类器
    3.4.4 决策规则分类器
    3.4.5 Rocchio分类器
    3.4.6 神经网络分类器
    3.4.7 支持向量机
    3.4.8 分类器融合
    3.4.9 Boosting分类器
    3.5 Bootstrapping算法
    3.5.1 AutoSlog-TS系统
    3.5.2 交互式Bootstrapping算法
    3.5.3 Metabootstrapping算法
    3.5.4 基于句法启发式的Bootstrapping算法
    3.5.5 Basilisk算法
    3.5.6 基于术语类别的Bootstrapping算法
    3.6 文本分类器的评价
    3.6.1 性能度量
    3.6.2 标准数据集
    3.6.3 分类器比较
    第4章 文本挖掘预处理——文本聚类
    4.1 聚类的任务
    4.1.1 检索召回率的改进
    4.1.2 检索正确率的改进
    4.1.3 分割/聚合
    4.1.4 特殊查询的聚类
    4.2 聚类的基本问题
    4.2.1 问题描述
    4.2.2 相似度量
    4.3 聚类算法
    4.3.1 K均值算法
    4.3.2 基于EM的概率模糊聚类算法
    4.3.3 层次聚类法
    4.3.4 其他聚类算法
    4.4 文本聚类
    4.4.1 文本聚类描述
    4.4.2 文本聚类中的特征选择
    4.4.3 文本聚类测试
    第5章 文本挖掘核心操作——信息抽取
    5.1 信息抽取简介
    5.2 信息抽取任务
    5.2.1 命名实体识别
    5.2.2 模板元素
    5.2.3 模板关系
    5.2.4 背景模板
    5.2.5 共指任务
    5.3 信息抽取实例
    5.3.1 事件框架抽取
    5.3.2 小情报类型的信息抽取
    5.3.3 信息抽取过程
    5.4 信息抽取系统的体系结构
    5.5 指代消解
    5.5.1 回指和共指
    5.5.2 代词消解方法
    5.6 规则学习
    5.6.1 WHISK
    5.6.2 BWI
    5.6.3 (LP)2算法
    5.6.4 实验评价
    5.7 视觉信息抽取
    5.7.1 视觉信息的概念
    5.7.2 视觉信息抽取任务
    5.7.3 视觉元素感知
    5.7.4 基于O-型树的视觉信息相似计算
    5.7.5 基于模板的视觉信息相似计算
    5.7.6 实验结果
    第6章 文本挖掘核心操作——关系抽取
    6.1 实体关系抽取
    6.1.1 实体关系
    6.1.2 实体关系抽取方法
    6.1.3 实体关系标注
    6.1.4 实体关系特征信息
    6.2 Web中的实体关系发现
    6.2.1 先确定关系模式的方法
    6.2.2 后确定关系模式的方法
    6.3 实体关系发现的难点
    6.3.1 实体关系对的确定
    6.3.2 实体关系描述文本的筛选与扩展
    6.3.3 实体关系对的验证
    6.3.4 实体关系体系的发现
    6.4 基于社会网络的实体关系发现
    6.4.1 社会网络概念
    6.4.2 社会网络构建
    6.4.3 实体关系发现
    6.5 实体包含关系的抽取
    6.5.1 特征选择
    6.5.2 实验结果及分析
    6.6 基于全信息的隐含的多实体关系抽取
    6.6.1 全信息的自然语言理解方法
    6.6.2 语法知识的自动抽取
    6.6.3 语义知识的自动抽取
    6.6.4 语用知识的自动抽取
    6.6.5 基于全信息的实体关系分析方法
    6.7.1 相关工作
    6.7.2 引入先验知识的核函数
    6.7.3 Convolution核函数
    6.7.4 基于语义核函数的KNN机器学习算法
    6.7 基于核函数的实体关系抽取
    6.8基于混合概率模型的实体关系抽取系统——TEG
    6.8.1 混合模型概述
    6.8.2 TEG文法说明
    6.8.3 TEG训练
    6.8.4 额外特征
    6.8.5 规则抽取实例
    6.8.6 TEG实验评估
    第7章 文本挖掘核心操作——关联分析
    7.1 实例——“9.11”劫机者
    7.2 网络的自动布局算法
    7.2.1 Kamada和Kawai(KK)方法
    7.2.2 Fruchterman-Reingold(FR)方法
    7.3 实体之间的关联路径
    7.4 中心性
    7.4.1 顶点中心性
    7.4.2 网络中心性
    7.4.3 概要图
    7.5 网络的分割
    7.5.1 基于核的分割算法
    7.5.2 经典图分隔算法
    7.5.3 基于实体之间等价的分割算法
    7.5.4 基于实体之间等价的分割算法
    7.6 网络中的模式匹配
    7.7 关联分析软件包
    7.7.1 Pajek
    7.7.2 UCINET
    7.7.3 NetMiner
    第8章 文本挖掘结果的可视化
    8.1 浏览器
    8.1.1 概念分布的显示和浏览
    8.1.2 关联的显示和搜索
    8.1.3 利用概念分层方法进行的导航和搜索
    8.2 表示层
    8.2.1 表示层编辑器
    8.2.2 表示层的访问约束和简单的过滤规范
    8.3 文本知识发现语言KDTL
    8.3.1 KDTL概述
    8.3.2 KDTL查询实例
    8.3.3 KDTL查询界面实现
    8.4 可视化方法
    8.4.1 可视化组件在文本挖掘系统中的位置
    8.4.2 文本挖掘的通用可视化方法
    第9章 文本挖掘的应用
    9.1 行业分析器
    9.1.1 基本架构和功能
    9.1.2 应用背景
    9.2 专利分析解决方案
    9.2.1 基础构架和功能
    9.2.2 应用背景
    9.3 生物学路径信息挖掘
    9.3.1 基本架构和功能
    9.3.2 应用背景
    第10章 专门用于文本挖掘的信息抽取语言——DIAL
    10.1 文本模式定义
    10.2 基于DIAL的信息抽取
    10.3 文本标注
    10.4 概念和规则结构
    10.5 模式匹配
    10.6 模板元素
    10.6.1 字符串常量
    10.6.2 字词类名称
    10.6.3 同义词名称
    10.6.4 概念名称
    10.6.5 字符级规则表达式
    10.6.6 字符类
    10.6.7 视觉属性
    10.6.8 词例模式元
    10.7 规则约束和概念保护
    10.7.1 规则约束
    10.7.2 概念保护
    10.8 DIAL实例
    10.8.1 基于标题/职位的人名抽取
    10.8.2 基于前驱动词的抽取人名列表
    10.8.3 同义词抽取位置名称
    10.8.4 创建本地人名词典
    10.8.5 一个简化的解决人称代词的指代消解规则
    10.8.6 家庭关系抽取
    参考文献
帮助中心
公司简介
联系我们
常见问题
新手上路
发票制度
积分说明
购物指南
配送方式
配送时间及费用
配送查询说明
配送范围
快递查询
售后服务
退换货说明
退换货流程
投诉或建议
版权声明
经营资质
营业执照
出版社经营许可证