点此搜书

面向非结构化文本的知识发现  基于英汉双语平行语料库的句法级知识挖掘和抽取研究
  • 作 者:王东波编
  • 出 版 社:北京:中国社会科学出版社
  • 出版年份:2013
  • ISBN:9787516126035
  • 标注页数:220 页
  • PDF页数:236 页
  • 请阅读订购服务说明与试读!

文档类型

价格(积分)

购买连接

试读

PDF格式

9

立即购买

点击试读

订购服务说明

1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。

2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源236 ≥220页】

图书下载及付费说明

1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

3、所有的电子图书都是原书直接扫描方式制作而成。

第一章 引言 1

一 课题提出 1

二 研究意义 2

三 研究方法 4

四 研究技术路线 5

五 研究创新点 7

六 本书结构和所用资源 8

第二章 相关研究综述 10

一 面向网络获取相关英汉双语平行语料的概述 10

二 词汇句法功能分布的相关研究概况 23

三 短语结构知识抽取的相关研究综述 33

四 类别知识挖掘的相关研究 41

第三章 面向网络的英汉双语平行语料库自动构建 48

一 确定获取语料网站和制定抓取词汇底表 48

二 网页的抓取和英汉双语平行语料的抽取 53

第四章 词汇句法功能分布复杂度呈现规律的知识挖掘 64

一 词汇句法功能分布复杂度统计数据源简介和句法结构调整 64

二 词汇句法功能分布复杂度的获取 81

三 词汇句法功能分布复杂度的洛特卡现象揭示 96

第五章 基于英汉双语平行语料库的短语结构知识抽取——以介宾短语结构为例 114

一 英汉双语介宾短语结构句法特征统计分析 115

二 有关介宾短语结构知识抽取模型构建的相关介绍和预处理 135

三 介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取 147

第六章 基于英汉双语平行语料库的复杂短语级类别知识挖掘 152

一 面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定 152

二 语料的预处理和相关统计 157

三 面向英汉双语复杂短语平行语料的词性选择 166

四 基于英汉双语复杂短语平行语料的类别知识挖掘 171

结语 181

参考文献 183

附录1宾州大学英语树库的词性标记 199

附录2宾州大学汉语树库的词性标记 200

附录3清华大学树库词性标记 201

附录4汉语自身特征模板 203

附录5英语自身特征模板 205

附录6汉语添加特征模板 207

附录7英语添加特征模板 210

附录8中国科学院和北京大学核心词性标注集 213

附录9BNC统计语料样例 214

后记 217

购买PDF格式(9分)
返回顶部