- 1、本文档共285页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
\o社交网站的数据挖掘与分析.docx\t/user_center_v1/doc/Doclist/audited/type/all/folder/all/format/all/uploadTime/all/orderField/default/orderAsc/asc/pageSize/50/keyword/%E6%95%B0%E6%8D%AE/page/3/commend/all/pagenumber/all/checkType/all/optimization/all/optimization_status/0/privateType/all/baseType/0/failType/0/applyState/0/risk_typeid/all/titleIllegal/all/contentIllegal/all/vipType/_blank社交网站
的数据挖掘与分析
目录
\h第1章绪论:Twitter数据的处理
\hPython开发工具的安装
\hTwitter数据的收集和处理
\h摆弄Twitter的API
\h频率分析和词汇多样性
\htweet图的可视化
\h综合应用:用Protovis可视化转发的tweet
\h小结
\h第2章微格式:语义标记和常识碰撞
\hXFN和朋友
\h使用XFN来探讨社交关系
\h对XFN数据的广度优先抓取
\h地理坐标:兴趣爱好的共同主线
\h维基百科文章+Google地图=自驾游是否成立
\h(以健康的名义)对菜谱进行交叉分析
\h对餐厅评论的搜集
\h小结
\h第3章邮箱:虽然老套却很好用
\hmbox:Unix的入门级邮箱
\hmbox+CouchDB=随意的Email分析
\h将文档批量加载到CouchDB中
\h合理的排序
\h映射/化简启发的频率分析
\hcouchdb-lucene:全文索引以及更多
\h将对话线程化到一起
\h看谁在说话
\h使用SIMILETimeline将邮件“事件”可视化
\h分析你自己的邮件数据
\hGraphYour(Gmail)InboxChrome扩展
\h小结
\h第4章Twitter:朋友、关注者和Setwise操作
\hREST风格的和OAuth-CladdedAPI
\h不,你不能知道我的密码
\h干练而中肯的数据采集器
\h一个非常简短的重构子程序
\hRedis:数据结构服务器
\h基本的集合操作
\h使用基本的朋友/关注者度量来增强性能
\h通过计算共同好友和关注者来计算相似性
\h影响的度量
\h友谊图的构建
\h派系检测与分析
\hInfochimp“强链接”API
\h交互式3D图的可视化
\h小结
\h第5章Twitter:tweet,所有的tweet,只有tweet
\h笔PK剑:和tweetPK机枪(?!?)
\h对tweet的分析(每次一个实体)
\h对(Tim的)Tweet的利用
\hTim最常转发谁的tweet
\hTim的影响力
\hTim的tweet中有多少包含hashtag
\h并置潜在的社交网站(或#JustinBieberVS#TeaParty)
\h#JustinBieber和#TeaParty的tweet中最常共同出现的实体
\h平均来说,#JustinBieber或#TeaParty,谁的tweet包含更多hashtag
\h谁更常被转发:#JustinBieber还是#TeaParty
\h#TeaParty和#JustinBieber的tweet实体之间存在多少重叠
\h对大量tweet的可视化
\h使用高级的标签云可视化tweet
\h对Twitter搜索结果中群集结构的可视化
\h小结
\h第6章LinkedIn:为了乐趣(和利润?)将职业网络聚类
\h聚类的动机
\h按职位将联系人聚类
\h规范并统计职位的数量
\h聚类常见的相似性度量
\h聚类的贪心方法
\h分层聚类和k均值聚类
\h获取补充个人信息
\h从地理上聚类网络
\h使用GoogleEarth标识职业网络
\h使用DorlingCartograms标识职业网络
\h小结
\h第7章GoogleBuzz:TF-I
您可能关注的文档
- Node与Express开发(第二版).docx
- 机器学习流水线实战.docx
- 数据科学中的实用统计学(第2版).docx
- 小型摩托车市场发展预测和趋势分析.docx
- 全身CT扫描机市场需求与消费特点分析.docx
- 和服外褂羽织项目投资评估报告.docx
- [吕梁]2023年山西医科大学汾阳学院招聘博士研究生笔试历年高频考点(难、易错点)附带答案详解.docx
- [吉林]2024年吉林北华大学招聘博士人才22人笔试历年高频考点(难、易错点)附带答案详解.docx
- [吉林]2023年吉林电子信息职业技术学院招聘2人(4号)笔试历年高频考点(难、易错点)附带答案详解.docx
- [吉安]2023年江西吉安市水利水电规划设计院人才招聘笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024染发行业趋势白皮书.pdf
- 企业行政前台电话接听礼仪培训课件.pdf
- 核药行业深度报告:高壁垒铸就双寡头,点亮核药星辰大海.pdf
- 茶饮行业深度报告:东方茶走进下沉,走向世界(202406).pdf
- [吉林]2023年吉林农业大学招聘18人(7号)笔试历年高频考点(难、易错点)附带答案详解.docx
- [台州]浙江台州市立医院招聘采购部工作人员笔试历年高频考点(难、易错点)附带答案详解.docx
- [吉安]2023年江西吉安职业技术学院机械与电子工程学院外聘教师招聘笔试历年高频考点(难、易错点)附带答案详解.docx
- [台州]浙江台州温岭市委机构编制委员会办公室招聘编外人员笔试历年高频考点(难、易错点)附带答案详解.docx
- [台州]浙江台州温岭市禁毒办招聘禁毒社工笔试历年高频考点(难、易错点)附带答案详解.docx
- [台州]浙江台州玉环市医疗保障局招聘编外工作人员笔试历年高频考点(难、易错点)附带答案详解.docx
最近下载
- Validation_master_plan验证主计划参考.doc
- 年产5万吨无水氟化氢、年产2万吨氟化氢铵、年产5000吨电子级氢氟酸项目可行性研究报告.pdf
- 课题汇报结题报告PPT模板.pptx VIP
- 2024年辅警招聘考试试题库新版.docx VIP
- 确定发展对象大会主持词.docx
- 第二课 把握逻辑要义 同步练习-2021-2022高中政治统编版选择性必修三逻辑与思维(word版含答案解析).docx
- GB_T 27930-2023_新能源充电新标准.pdf
- 一般过去时全英教学设计.docx VIP
- MBTI职业性格测试PPT模板(含完整内容)1.pptx VIP
- 建筑电气专项施工方案.pptx
文档评论(0)