本书以中文信息处理的学科发展脉络为线索,介绍了中文信息处理在不同历史时期中的发展情况与主要成果。本书首先简要介绍了中文信息处理学科的基本概况,然后以起步期、发展期、成熟期、繁荣期等不同的历史阶段,分章节对中文信息处理各个历史阶段的发展过程和成果进行了具体阐述。本书以时间为轴,将中文信息处理研究的方方面面介绍给读者,同时也将中文信息处理这一学科从无到有、从小到大、从弱到强的发展过程呈现出来。
样章试读
目录
- 目录
序
第一章 绪论 1
第一节 中文信息处理概述 1
一、什么是中文信息处理 1
二、研究中文信息处理的意义 3
第二节 中文信息处理的内容 5
一、中文信息处理的研究范围 5
二、中文信息处理的研究方法 6
三、常见的应用系统 8
第三节 中文信息处理研究的格局 10
一、中文信息处理与相关学科的关系 10
二、中文信息处理的研究取向 11
三、中文信息处理研究的基本历史分期 13
参考文献 14
第二章 中文信息处理的起步期 16
第一节 中文信息处理问题的诞生背景及萌芽 16
一、自然语言处理的理论准备 16
二、自然语言处理的发端 18
三、中文信息处理的萌芽 19
第二节 中文信息处理问题的兴起 22
一、沉寂后的复苏 22
二、汉字信息处理时代的到来 24
三、汉字精密照排系统的发展 27
第三节 汉字编码工作的开展 28
一、汉字编码的基本任务 28
二、字频统计工作的展开 30
三、万“码”奔腾时代的到来 32
四、汉字交换码标准的编制及发展 34
五、汉字编码的国际标准 37
第四节 汉字的输入及输出技术 38
一、键盘输入技术 38
二、汉字自动识别输入 44
三、汉语语音识别输入 47
四、汉字的存储及输出技术 50
第五节 起步期的应用研究及理论探索 55
一、从机器翻译到自然语言理解 55
二、自然语言理解与人机对话 59
三、信息检索及相关技术 61
四、学会组织的建立与发展 63
第六节 小结 65
参考文献 66
第三章 中文信息处理的发展期 70
第一节 “词”处理时代的到来 70
一、“词”处理的基本任务 70
二、词频统计与词表编制 72
第二节 语料库的发展与建设 74
一、统计方法的复苏与语料库的发展 74
二、我国的早期语料库建设 77
第三节 自动分词技术的发展 78
一、自动分词的困境 78
二、自动分词方法的探索 80
三、歧义与未登录词 85
四、自动分词系统的研制 89
五、分词规范的编订 91
六、自动分词技术的评测 93
第四节 词性标注技术的发展 95
一、词性标注与词类划分 95
二、词性标注中的兼类词难题 99
三、词性标注技术的发展 101
第五节 语音处理技术的突破 103
一、隐马尔可夫模型 103
二、语音识别技术的新进展 104
三、语音合成技术 105
第六节 应用研究的发展 109
一、“语言工程”概念的提出 109
二、机器翻译的新发展 110
三、计算机辅助语言教学与测试 112
第七节 小结 114
参考文献 115
第四章 中文信息处理的成熟期 119
第一节 成熟期的基本格局 119
一、统计方法的回归 119
二、从“词”处理到“句”处理 123
三、“句”处理的主要困难 125
第二节 句法分析与语义分析 127
一、句法、语义分析技术的发展背景 127
二、句法分析理论的两大体系 130
三、汉语句法分析方法的探索 134
四、语义资源及语义分析理论的发展 138
五、语义消歧与语义标注 142
第三节 基础资源库建设 147
一、语料库迅猛发展 147
二、大规模语言知识库建设 149
第四节 应用型技术及相关研究 158
一、机器翻译 158
二、网络技术下的新动向 161
第五节 小结 165
参考文献 167
第五章 中文信息处理的繁荣期 171
第一节 研究范式的彻底转向 171
一、从人工神经网络到深度学习 171
二、人工智能与大数据 173
三、语音识别技术的突飞猛进 176
第二节 新时期的中文信息处理 178
一、中文信息处理的新特点 178
二、基于深度学习的中文信息处理研究 180
三、新研究领域的拓展 184
四、应用型技术的百花齐放 186
第三节 深度学习语境下的新挑战 189
一、语言学知识有待回归 189
二、进一步拓展与深化新的应用领域 191
三、与认知科学及脑神经科学相结合 194
四、走向多模态信息处理 197
五、深入国际交流与合作 201
第四节 小结 203
参考文献 205
后记 207