基于web数据挖掘的微博用户特征分析-analysis of microblog user characteristics based on web data mining.docxVIP

  • 11
  • 0
  • 约4.34万字
  • 约 61页
  • 2018-05-18 发布于上海
  • 举报

基于web数据挖掘的微博用户特征分析-analysis of microblog user characteristics based on web data mining.docx

基于web数据挖掘的微博用户特征分析-analysis of microblog user characteristics based on web data mining

IIIAbstractTheadvantageofWebdataminingtechnologyintheanalysisofuserbehaviorcharacteristics.Theclassificationofuserandthecharacteristicsofthedifferentusersthroughminingresearchonmicro-blogusersrelevantdataandinformation,usingk-meansclusteringalgorithmclassificationof micro-blogusers,realizedthemodelisestablished,andaccordingtotheuserattributeminingdifferencebetweenordinaryusersandVIPusersintheirarea,providesaapracticalandefficientmethodforthemicro-blogusers,ordinaryusersandVIP miningusercharacteristics,analysisofusermodel,fortheclassificationofusercommunity.Inordertomicro-blogenterprisesaccordingtodifferentcustomerspersonalizedservice,reasonableallocationofserviceresources.Keywords:Microblogging;Clustering;Associationanalysis;WebDataMining目录1.绪论11.1课题研究背景及国内外现状11.1.1课题研究背景11.1.2国内外的现状21.2课题研究意义21.3论文结构32.3用户关注度挖掘72.3.1用户关注度建模72.3.2用户关注度信息获取82.3.3用户关注度的表示82.3.4关注模型的更新92.3文本聚类技术102.3.1文本和网页的预处理102.3.2信息检索模型122.4本章小结123结构化数据抽取133.1两种富含数据的网页133.2数据模型143.3数据实例的HTML标记编码153.4基于列表页的抽取:平坦数据记录183.4.1两种观察结果183.4.2数据的挖掘区域203.4.3节点的比较213.4.4嵌套数据记录253.5常见的聚类算法313.6聚类结果的评价标准323.7关联规则333.7.1关联规则的概念343.7.2关联规则挖掘的分类343.7.3Apriori算法353.7.4Apriori算法基本思想及其改进373.8决策树算法383.9本章小结394用户特征分析与核心用户挖掘414.1数据的获取414.2聚类结果分析414.3名人特征挖掘434.4普通用户特征434.5核心用户挖掘454.5.1社会网络整体分析454.5.2社区挖掘464.6本章小结485总结与展望495.1全文总结495.2论文的展望49致谢 51参考文献531.绪论1.1课题研究背景及国内外现状1.1.1课题研究背景随着互联网技术的不断发展,人类社会发展到今天已经进入信息时代,高速扩展的网络将人与人之间的距离缩小并改变着人们的传统生活习惯。随着互联网在数量、大小和复杂度等方面的改变,互联网已经发展成为全球性的数据体系。根据研究显示,截止到现在,全球每年网络服务器数量都在急剧增加,而每天新的网站也在以超过50%的比例增长,这些信息数据在我们网络用户面前形成了一个巨大的知识海洋。然而,在如此巨大的海量网络信息前面,大多数上网者都觉无所适从,常常不知道该干什么,如何获取个人需要的知识信息,避免时间精力的浪费。许多上网者他们都希望可以利用互联网来达到某些目的或得到某些需要,然而,许多用户可能不知道自己的目的是什么,所以,这些用户希望可以从另外也有相关关注的上网者的访问行为中得到一些有用的参考,这就需要研究人员能够对上网者访问的网站及浏览的页面进行相关的研究,依据研究结果得到他们的关注所在,然后,根据上网的喜好和动态及时的改变网站的界面和样式,从而为上网者提供个性化的网站服务以及满足他们的一些需求。所以,怎样快速简洁地发现上网者的需求,为上网者提供他们感兴趣的的数据和知识,就显得尤为重要,也是一个值得花时间研究的课题。Web为数据挖掘提供了大量的数据资源,其中包括Web网站的内容信息、超链接网站、各种导航以及大量用户日志访问记录数据。于是,Web数据挖掘就慢慢的开始被人们所重视起来。现在多数数据库应用管理系统没有能力对它们中的数据进行挖掘而发现包含着的隐含信息,它们只是简单的对数据库中的数据进行一般

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档