点此搜书

数据挖掘中的集成方法  通过集成预测来提升精度
  • 作 者:(美)赛尼,(美)艾德著;王攀,张健,杨洋等译
  • 出 版 社:北京:科学出版社
  • 出版年份:2015
  • ISBN:9787030443274
  • 标注页数:96 页
  • PDF页数:111 页
  • 请阅读订购服务说明与试读!

文档类型

价格(积分)

购买连接

试读

PDF格式

6

立即购买

点击试读

订购服务说明

1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。

2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源111 ≥96页】

图书下载及付费说明

1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

3、所有的电子图书都是原书直接扫描方式制作而成。

第1章 集成发现 1

1.1 建立集成 5

1.2 正则化 6

1.3 现实世界中的实例:信用评分+网飞挑战 7

1.4 本书的组织架构 8

第2章 预测学习和决策树 10

2.1 决策树归纳纵览 14

2.2 决策树的性能 16

2.3 决策树的缺陷 17

第3章 模型复杂度、模型选择和正则化 19

3.1 什么是树的“合适”规模 19

3.2 偏差-方差分解 20

3.3 正则化 23

3.3.1 正则化与成本-复杂度树修剪 23

3.3.2 交叉验证 24

3.3.3 运用收缩的正则化 26

3.3.4 通过构建增量模型的正则化 30

3.3.5 实例 31

3.3.6 正则化综述 34

第4章 重要性采样和经典集成方法 36

4.1 重要性采样 39

4.1.1 参数重要性测度 40

4.1.2 扰动采样 42

4.2 泛化集成生成 42

4.3 Bagging 44

4.3.1 实例 47

4.3.2 为什么Bagging有用 51

4.4 随机森林 51

4.5 AdaBoost 53

4.5.1 实例 54

4.5.2 为什么使用指数损失 56

4.5.3 AdaBoost的总体最小值 57

4.6 梯度Boosting 58

4.7 MART 59

4.8 并行集成与顺序集成的比较 59

第5章 规则集成和解释统计 61

5.1 规则集成 61

5.2 解释 63

5.2.1 仿真数据实例 64

5.2.2 变量重要性 68

5.2.3 偏相关 69

5.2.4 交互统计 70

5.3 制造业数据实例 70

5.4 总结 74

第6章 集成复杂性 75

6.1 复杂性 75

6.2 广义自由度 77

6.3 实例:带有噪声的决策树表面 78

6.4 广义自由度的R代码和实例 82

6.5 总结与讨论 83

参考文献 85

附录A AdaBoost与FSF程序的等价性 90

附录B 梯度Boosting和鲁棒损失函数 93

购买PDF格式(6分)
返回顶部