点此搜书

社交网站的数据挖掘与分析
  • 作 者:(美)罗素著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2012
  • ISBN:9787111369608
  • 标注页数:302 页
  • PDF页数:314 页
  • 请阅读订购服务说明与试读!

文档类型

价格(积分)

购买连接

试读

PDF格式

11

立即购买

点击试读

订购服务说明

1、本站所有的书默认都是PDF格式,该格式图书只能阅读和打印,不能再次编辑。

2、除分上下册或者多册的情况下,一般PDF页数一定要大于标注页数才建议下单购买。【本资源314 ≥302页】

图书下载及付费说明

1、所有的电子图书为PDF格式,支持电脑、手机、平板等各类电子设备阅读;可以任意拷贝文件到不同的阅读设备里进行阅读。

2、电子图书在提交订单后一般半小时内处理完成,最晚48小时内处理完成。(非工作日购买会延迟)

3、所有的电子图书都是原书直接扫描方式制作而成。

前言 1

第1章绪论:Twitter数据的处理 9

Python开发工具的安装 9

Twitter数据的收集和处理 11

小结 24

第2章微格式:语义标记和常识碰撞 26

XFN和朋友 27

使用XFN来探讨社交关系 29

地理坐标:兴趣爱好的共同主线 37

(以健康的名义)对菜谱进行交叉分析 41

对餐厅评论的搜集 43

小结 45

第3章邮箱:虽然老套却很好用 47

mbox:Unix的入门级邮箱 48

mbox+CouchDB=随意的Email分析 54

将对话线程化到一起 70

使用SIMILE Timeline将邮件“事件”可视化 79

分析你自己的邮件数据 82

小结 84

第4章Twitter:朋友、关注者和Setwise操作 85

REST风格的和OAuth-Cladded API 86

干练而中肯的数据采集器 90

友谊图的构建 108

小结 116

第5章Twitter: tweet,所有的tweet,只有tweet 118

笔PK剑:和tweet PK机枪(?!?) 118

对tweet的分析(每次一个实体) 121

并置潜在的社交网站(或#JustinBieber VS #TeaParty) 144

对大量tweet的可视化 155

小结 163

第6章Linkedin:为了乐趣(和利润?)将职业网络聚类 164

聚类的动机 165

按职位将联系人聚类 167

获取补充个人信息 183

从地理上聚类网络 188

小结 192

第7章GoogleBuzz:TF-IDF、余弦相似性和搭配 194

Buzz=Twitter+博客(???) 195

使用NLTK处理数据 198

文本挖掘的基本原则 201

查找相似文档 208

在二元语法中发Buzz 215

利用Gmail 221

在中断之前试着创建一个搜索引擎 225

小结 226

第8章博客及其他:自然语言处理(等) 228

NLP:帕累托式介绍 228

使用NLTK的典型NLP管线 231

使用NLTK检测博客中的句子 234

对文件的总结 237

以实体为中心的分析:对数据的深层了解 245

小结 256

第9章Facebook:一体化的奇迹 257

利用社交网络数据 258

对Facebook数据的可视化 274

小结 294

第10章语义网:简短的讨论 296

发展中的变革 296

人不可能只靠事实生活 297

期望 301

购买PDF格式(11分)
返回顶部