点此搜书

Web文本挖掘技术理论与应用
  • 作 者:何慧,陈博,张莹编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2017
  • ISBN:9787121298271
  • 标注页数:101 页
  • PDF页数:111 页
  • 请阅读订购服务说明与试读!

文档类型

价格(积分)

购买连接

试读

PDF格式

7

立即购买

点击试读

订购服务说明

1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。

2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源111 ≥101页】

图书下载及付费说明

1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

3、所有的电子图书都是原书直接扫描方式制作而成。

第1章 概论 1

1.1 研究的背景和意义 1

1.2 文本挖掘相关技术概述及研究现状 2

1.2.1 文本分类概述及研究现状 3

1.2.2 文本聚类概述及研究现状 5

1.2.3 信息抽取概述及研究现状 6

1.2.4 文本检索概述及研究现状 7

1.3 文本挖掘领域亟待解决的问题 8

1.4 本书的研究内容与结构安排 11

参考文献 13

第2章 基于统计语言模型的短文本计算 18

2.1 引言 18

2.2 文本信息处理基础知识 19

2.2.1 文本的表示 19

2.2.2 特征选择 21

2.3 基于N-gram的特征提取和RPCL的短文本聚类算法 22

2.3.1 相关工作 23

2.3.2 算法描述 23

2.3.3 实验及分析 28

2.4 小结 31

参考文献 31

第3章 面向广告推荐和情感分析的Web文本信息抽取 35

3.1 引言 35

3.2 信息抽取常用算法和模型 36

3.2.1 N-gram语言模型 36

3.2.2 隐马尔可夫模型 37

3.2.3 最大熵模型 38

3.3 基于隐马尔科夫模型的半监督中文复合词抽取算法 41

3.3.1 相关工作 42

3.3.2 算法描述 42

3.3.3 实验及分析 46

3.4 基于最大熵和LMR模板的中文情感词抽取算法 48

3.4.1 相关工作 49

3.4.2 算法描述 50

3.4.3 实验及分析 51

3.5 小结 55

参考文献 55

第4章 基于监督和半监督的文本情感分类 59

4.1 引言 59

4.2 常用的监督和半监督文本分类算法 60

4.2.1 常用文本分类算法 61

4.2.2 半监督文本分类算法 63

4.3 文本情感分类的研究现状 66

4.3.1 主客观分类 66

4.3.2 情感极性分类 66

4.4 基于带先验的最大熵歌词情感分类 68

4.4.1 相关工作 68

4.4.2 歌词语料集统计信息 69

4.4.3 算法描述 71

4.4.4 实验及分析 74

4.5 基于图的半监督学习文本情感分类算法 76

4.5.1 算法描述 77

4.5.2 实验及分析 79

4.6 小结 82

参考文献 82

第5章 文本观点检索研究 89

5.1 引言 89

5.2 相关研究 89

5.3 文本观点检索系统设计与评测 90

5.3.1 COAE2008观点检索任务、数据及相关评测指标 91

5.3.2 文本观点检索系统 92

5.4 小结 96

参考文献 96

第6章 总结与展望 99

6.1 本书的总结 99

6.2 未来的工作展望 101

购买PDF格式(7分)
返回顶部