借助大规模真实语料探究人类语言的本质规律及其机制,是数智时代语言学家的主要任务之一。本书精选了笔者近年来的研究成果,较为系统、全面地展示了以大规模依存树库为基础,围绕语言的线性结构和网络结构对语言这一“人驱复杂适应系统”所做的探索,其中包括已在相关领域得到广泛认可的“依存距离最小化”和“依存方向连续统”等。全书内容丰富、结构明晰、友好易读,较好地回答了“什么是数据驱动的语言研究”、“为什么要开展相关研究”,以及“应该如何开展”等问题。
样章试读
目录
- 目录
从无序中寻找有序
写在前面的话
依存关系计量研究
第一章 依存距离和依存方向 3
第一节 依存关系的基本概念 3
第二节 依存距离作为衡量语言理解难度的计量指标 10
第三节 依存方向作为面向语序类型研究的计量指标 26
第二章 影响依存距离和依存方向的因素 39
第一节 句长 39
第二节 语体 52
第三节 标注方式 63
第三章 依存距离最小化及其形成机理 83
第一节 汉语依存距离的概率分布 83
第二节 30种语言的依存距离分布规律 90
第三节 交叉依存与依存距离的关系 103
第四节 组块在降低自然语言句法复杂度中的作用 113
第四章 依存结构的计量特征及其应用 124
第一节 汉语句法及类型特征 124
第二节 依存距离最小化与汉语的“VP+N1+的+N2”结构 131
第三节 罗曼语族语言的类型特征 136
第四节 依存距离和动态配价 145
第五节 依存结构层级的分布规律 159
第六节 依存距离与层级距离 166
第七节 依存结构树句长、树宽、树高之间的协同关系 174
语言复杂网络研究
第五章 语言网络的整体特征 187
第一节 语言是一个复杂网络 187
第二节 汉语句法网络的复杂性 201
第三节 汉语语义网络的复杂性 208
第四节 汉语音素网络的复杂性 215
第六章 现代汉语多层级复杂网络研究 224
第一节 引言 224
第二节 汉语多层级网络的构建 226
第三节 汉语四个层级网络的复杂性特征 230
第四节 从复杂网络参数看汉语层级结构特点 234
第七章 语言网络的局部特征 240
第一节 句法在语言网络中的作用 240
第二节 汉语句法网络的中心节点 243
第三节 局部句法结构与网络整体特征的关系 253
第八章 语言网络应用研究 265
第一节 基于语言网络的语言分类 265
第二节 句法网络与语言的形态复杂度 276
第三节 词同现语言网络与斯拉夫语族语言分类 285
第四节 基于句法网络和语义网络的语体分类 292
第五节 复杂网络视角的翻译研究 300
参考文献 306
附录一 从依存距离到语言学交叉学科研究 328
附录二 大数据时代的语言研究 338
附录三 数智时代的(应用)语言学杂谈 356
附录四 语言学理论研究如何应对智能时代的挑战 368
写在后面的话 382