点此搜书

基于支持向量机的聚类及文本分类关键技术研究
  • 作 者:平源,周亚建,杨义先著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2014
  • ISBN:9787115332691
  • 标注页数:184 页
  • PDF页数:193 页
  • 请阅读订购服务说明与试读!

文档类型

价格(积分)

购买连接

试读

PDF格式

8

立即购买

点击试读

订购服务说明

1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。

2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源193 ≥184页】

图书下载及付费说明

1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

3、所有的电子图书都是原书直接扫描方式制作而成。

第1章 绪论 1

1.1 引言 1

1.2 机器学习理论 2

1.2.1 无监督学习 3

1.2.2 有监督学习 3

1.2.3 半监督学习 3

1.2.4 增强学习 4

1.3 支持向量机与聚类分析 4

1.4 支持向量机与文本分类 7

1.5 本书的主要工作 10

第2章 支持向量机技术基础 13

2.1 引言 13

2.2 统计学习理论 13

2.3 支持向量机技术 16

2.3.1 支持向量分类机 16

2.3.2 L2-支持向量机 19

2.3.3 多类问题的决策方法 21

2.3.4 支持向量回归机模型 23

2.3.5 支持向量机研究现状 24

2.4 支持向量聚类 29

2.4.1 支持向量聚类模型 29

2.4.2 影响支持向量聚类的关键因素 32

2.5 本章小结 40

第3章 双质心支持向量聚类 41

3.1 引言 41

3.2 噪声数据点消除策略 43

3.2.1 噪声数据分布结构分析 43

3.2.2 噪声数据消除算法 45

3.3 双质心簇标定策略 47

3.3.1 簇的分解策略 47

3.3.2 单组件双质心的构造 48

3.3.3 成员关系的判定规则 50

3.3.4 算法描述 51

3.4 DBC时间性能分析 52

3.5 聚类实验分析 53

3.5.1 数据集 53

3.5.2 实验对比算法 53

3.5.3 噪声数据消除实验 54

3.5.4 DBC聚类效果测试 57

3.5.5 DBC整体性能测试 59

3.5.6 DBC模型的半监督应用测试 60

3.6 本章小结 60

第4章 基于凸分解的簇标定算法 63

4.1 引言 63

4.2 基于凸分解的簇标定算法 64

4.2.1 簇在特征空间中的凸性质 64

4.2.2 支持超凸多面体的凸分解 65

4.2.3 凸包的标定算法 72

4.2.4 标定非凸包样本 76

4.3 CDCL算法时间性能分析 76

4.4 聚类实验分析 78

4.4.1 数据集 78

4.4.2 实验对比算法 79

4.4.3 CDCL算法适应能力分析 80

4.4.4 CDCL算法整体性能测试 82

4.5 本章小结 87

第5章 快速支持向量聚类算法 89

5.1 引言 89

5.2 快速支持向量聚类算法(FASVC) 90

5.2.1 选择簇边界样本 90

5.2.2 构造超球面 92

5.2.3 自适应的簇标定策略 96

5.2.4 FASVC算法的实现 97

5.3 FASVC时间性能及特点分析 99

5.3.1 FASVC时间性能分析 99

5.3.2 FASVC算法特点 100

5.4 聚类实验分析 101

5.4.1 数据集 102

5.4.2 实验对比算法 102

5.4.3 FASVC参数敏感性测试 103

5.4.4 FASVC算法整体性能测试 104

5.4.5 利用FASVC进行文本聚类 110

5.4.6 利用FASVC识别P2P流量 111

5.5 本章小结 112

第6章 基于支持向量机的多模式文本分类研究 113

6.1 引言 113

6.2 文本表示的关键问题与启示 114

6.2.1 场景1:特征的文档频率之外的信息 116

6.2.2 场景2:最大值保留的特征权重与特征的多类别分布信息 116

6.2.3 场景3:文本的结构信息 118

6.3 基于支持向量机的多模式文本分类方案 120

6.3.1 自适应的文本块划分算法 120

6.3.2 兼顾类别贡献度和类间区分度的特征权重方案 121

6.3.3 融合多类别倾向的特征类间区分能力强化方案 122

6.3.4 基于文本块重要性分布加权的特征频率方案 124

6.4 分类实验分析 125

6.4.1 数据集 125

6.4.2 实验对比方案 127

6.4.3 评价指标 129

6.4.4 CCE方案实验结果与分析 130

6.4.5 C2TCTVT算法框架实验结果与分析 135

6.4.6 NWET与N2WET组合方案实验结果与分析 145

6.5 本章小结 153

结束语 154

参考文献 158

名词索引 180

购买PDF格式(8分)
返回顶部