
- 作 者:刘鹏,张燕,付雯,陈甫,李法平
- 出 版 社:北京:清华大学出版社
- 出版年份:2018
- ISBN:9787302500704
- 标注页数:219 页
- PDF页数:234 页
请阅读订购服务说明与试读!
订购服务说明
1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。
2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源234 ≥219页】
图书下载及付费说明
1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。
2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)
3、所有的电子图书都是原书直接扫描方式制作而成。
第1章 大数据的概念及其应用 1
1.1 大数据的概念 1
1.2 大数据的来源 3
1.3 大数据的特征及意义 5
1.4 大数据的表现形态 9
1.5 大数据的应用场景 11
1.5.1 大数据在企业中的应用 11
1.5.2 大数据在物联网中的应用 12
1.5.3 大数据在在线社交网络的应用 12
1.5.4 大数据在健康和医疗中的应用 13
1.5.5 大数据在群智感知中的应用 14
1.6 习题 15
第2章 大数据的架构 17
2.1 云计算 17
2.1.1 云计算的概念 17
2.1.2 云计算的特点 18
2.1.3 云计算的服务方式 19
2.1.4 云计算的应用 20
2.2 大数据架构介绍 23
2.2.1 大数据的分类 23
2.2.2 数据类型 26
2.2.3 大数据解决方案 28
2.3 Hadoop体系架构 36
2.3.1 Hadoop概述 36
2.3.2 Hadoop核心组件 39
2.4 上机与项目实训 40
2.5 习题 40
第3章 大数据采集及预处理 41
3.1 大数据采集 41
3.1.1 概念 41
3.1.2 采集工具 42
3.1.3 采集方法 47
3.2 数据预处理 53
3.2.1 数据清洗 53
3.2.2 数据集成 56
3.2.3 数据转换 58
3.2.4 数据归约 59
3.3 常用ETL工具 60
3.3.1 概念 60
3.3.2 常用ETL工具比较 62
3.4 习题 63
第4章 大数据的存储 64
4.1 面临的挑战 64
4.1.1 系统问题 64
4.1.2 管理问题 79
4.1.3 应用问题 80
4.2 大数据存储方式 82
4.2.1 分布式系统 82
4.2.2 NoSQL数据库 90
4.2.3 云存储 95
4.3 数据仓库 98
4.3.1 数据仓库的组成 98
4.3.2 数据仓库的构建步骤 99
4.3.3 数据集市 102
4.4 习题 104
第5章 大数据分析 105
5.1 数据分析概念和分类 105
5.1.1 数据分析的概念和作用 105
5.1.2 数据分析的类型 106
5.2 数据分析方法 108
5.2.1 数据分析方法概述 108
5.2.2 数据来源 109
5.2.3 数据分析活动步骤 110
5.2.4 分析数据 112
5.3 数据挖掘 113
5.3.1 基本概念 113
5.3.2 数据挖掘常用算法 115
5.3.3 分类 117
5.3.4 聚类 120
5.3.5 关联规则 122
5.3.6 大数据挖掘工具 124
5.3.7 数据挖掘算法应用 128
5.4 上机与项目实训 134
5.5 习题 137
第6章 大数据可视化 140
6.1 数据可视化基础 140
6.1.1 数据可视化的基本特征 140
6.1.2 数据可视化的作用 142
6.1.3 数据可视化流程 143
6.2 大数据可视化方法 144
6.2.1 文本可视化 144
6.2.2 网络(图)可视化 146
6.2.3 多维数据可视化 149
6.3 大数据可视化软件与工具 151
6.3.1 Excel 151
6.3.2 Processing 152
6.3.3 ECharts 155
6.4 习题 158
第7章 大数据的商业应用 159
7.1 国外大数据应用经典案例 159
7.1.1 资源数量的重要性 160
7.1.2 数据之间的相关性 160
7.1.3 任何数据都存在商机 161
7.1.4 大数据新价值的挖掘 162
7.1.5 大数据在医疗行业的应用 162
7.2 国内大数据应用经典案例 164
7.2.1 智慧城市 164
7.2.2 保险行业 167
7.2.3 智慧医疗 170
7.2.4 交通大数据 171
7.2.5 环境大数据 177
7.2.6 农业 185
7.2.7 零售行业 186
7.2.8 大数据舆情分析 186
7.2.9 物流行业 188
7.2.10 房地产业 189
7.2.11 地震面前,大数据来拯救 189
7.2.12 暑假出境游大数据分析 191
7.2.13 互联网大数据 192
7.3 习题 192