购买云解压PDF图书

当前位置: R语言与数据挖掘最佳实践和经典案例 > 购买云解压PDF图书
R语言与数据挖掘最佳实践和经典案例
  • 作 者:(澳)YANCHANGZHAO著;陈健,黄琰译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2014
  • ISBN:9787111475415
  • 注意:在使用云解压之前,请认真核对实际PDF页数与内容!

在线云解压

价格(点数)

购买连接

说明

转为PDF格式

9

立即购买

(在线云解压服务)

云解压服务说明

1、本站所有的云解压默认都是转为PDF格式,该格式图书只能阅读和打印,不能再次编辑。

云解压下载及付费说明

1、所有的电子图书云解压均转换为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、云解压在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

第1章 简介 1

1.1 数据挖掘 1

1.2 R 1

1.3 数据集 2

1.3.1 iris数据集 2

1.3.2 bodyfat数据集 3

第2章 数据的导入与导出 4

2.1 R数据的保存与加载 4

2.2 CSV文件的导入与导出 4

2.3 从SAS中导入数据 5

2.4 通过ODBC导入与导出数据 6

2.4.1 从数据库中读取数据 7

2.4.2 从Excel文件中导入与导出数据 7

第3章 数据探索 8

3.1 查看数据 8

3.2 探索单个变量 10

3.3 探索多个变量 12

3.4 更多探索 15

3.5 将图表保存到文件中 19

第4章 决策树与随机森林 21

4.1 使用party包构建决策树 21

4.2 使用rpart包构建决策树 24

4.3 随机森林 29

第5章 回归分析 33

5.1 线性回归 33

5.2 逻辑回归 38

5.3 广义线性回归 38

5.4 非线性回归 40

第6章 聚类 41

6.1 k-means聚类 41

6.2 k-medoids聚类 43

6.3 层次聚类 45

6.4 基于密度的聚类 46

第7章 离群点检测 50

7.1 单变量的离群点检测 50

7.2 局部离群点因子检测 53

7.3 用聚类方法进行离群点检测 56

7.4 时间序列数据的离群点检测 58

7.5 讨论 59

第8章 时间序列分析与挖掘 60

8.1 R中的时间序列数据 60

8.2 时间序列分解 60

8.3 时间序列预测 62

8.4 时间序列聚类 63

8.4.1 动态时间规整 63

8.4.2 合成控制图的时间序列数据 64

8.4.3 基于欧氏距离的层次聚类 65

8.4.4 基于DTW距离的层次聚类 66

8.5 时间序列分类 67

8.5.1 基于原始数据的分类 67

8.5.2 基于特征提取的分类 68

8.5.3 k-NN分类 69

8.6 讨论 70

8.7 延伸阅读 70

第9章 关联规则 71

9.1 关联规则的基本概念 71

9.2 Titanic数据集 71

9.3 关联规则挖掘 73

9.4 消除冗余 78

9.5 解释规则 79

9.6 关联规则的可视化 80

9.7 讨论与延伸阅读 82

第10章 文本挖掘 84

10.1 Twitter的文本检索 84

10.2 转换文本 85

10.3 提取词干 86

10.4 建立词项-文档矩阵 88

10.5 频繁词项与关联 90

10.6 词云 91

10.7 词项聚类 92

10.8 推文聚类 94

10.8.1 基于k-means算法的推文聚类 94

10.8.2 基于k-medoids算法的推文聚类 96

10.9 程序包、延伸阅读与讨论 98

第11章 社交网络分析 99

11.1 词项网络 99

11.2 推文网络 102

11.3 双模式网络 107

11.4 讨论与延伸阅读 110

第12章 案例Ⅰ:房价指数的分析与预测 111

12.1 HPI数据导入 111

12.2 HPI数据探索 112

12.3 HPI趋势与季节性成分 118

12.4 HPI预测 120

12.5 房地产估价 122

12.6 讨论 122

第13章 案例Ⅱ:客户回复预测与效益最大化 123

13.1 简介 123

13.2 KDD Cup 1998的数据 123

13.3 数据探索 131

13.4 训练决策树 137

13.5 模型评估 140

13.6 选择最优决策树 143

13.7 评分 145

13.8 讨论与总结 148

第14章 案例Ⅲ:内存受限的大数据预测模型 150

14.1 简介 150

14.2 研究方法 150

14.3 数据与变量 151

14.4 随机森林 152

14.5 内存问题 153

14.6 样本数据的训练模型 154

14.7 使用已选变量建立模型 156

14.8 评分 162

14.9 输出规则 168

14.9.1 以文本格式输出规则 168

14.9.2 输出SAS规则的得分 172

14.10 总结与讨论 177

第15章 在线资源 178

15.1 R参考文档 178

15.2 R 178

15.3 数据挖掘 179

15.4 R的数据挖掘 180

15.5 R的分类与预测 181

15.6 R的时间序列分析 181

15.7 R的关联规则挖掘 181

15.8 R的空间数据分析 181

15.9 R的文本挖掘 182

15.10 R的社交网络分析 182

15.11 R的数据清洗与转换 182

15.12 R的大数据与并行计算 182

R语言数据挖掘参考文档 184

参考资料 197

通用索引 201

包索引 203

函数索引 204

购买PDF格式(9分)
返回顶部