- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关注者相似度分析的微博用户标签推荐系统的设计与实现-计算机技术专业论文
Design and Implementation of The Microblog User Tag Recommendation System
based on Similarity Analysis of Attention
A Dissertation Submitted to
the Graduate School of Henan University in Partial Fulfillment of the Requirements for the Degree of
Master of Engineering Science
By
Guo Heng Supervisor: Li Min. May,2015
摘 要
近年来随着科学技术在我国较快速的发展,微博在我们的社会和生活中扮演了很 重要的角色,用户可以通过微博发送和获取大量的信息,也可以和其他用户进行交互, 来实现信息的实时评论、转发等操作。由于微博每天产生的信息量巨大,如何从大量 的微博信息中挖掘出有价值的信息,是现代互联网应用范围很广的一个产业,在这一 产业中,用户兴趣特征对挖掘微博的价值非常重要。然而,传统的用户兴趣挖掘方法 却无法较好的适应微博的特点。所以,本文在现有微博兴趣挖掘方法的基础上,设计 了基于关注者相似度分析的微博用户标签推荐系统,根据用户的标签信息来显示出用 户的兴趣所在。其中,本文挖掘的关注者主要包括当前用户的关注者和关注当前用户 的粉丝。本文所做的主要工作包括以下几个方面:
(1)针对微博特点,设计了基于关注者相似度分析的微博用户标签推荐系统,首 先对系统的整体框架进行了设计,然后,在微博数据的获取方式上,本文主要采用了 以新浪微博开放平台 API 接口为主,以网络爬虫为辅的方式来获取用户信息。
(2)对获取的用户数据信息进行预处理,将重复和对推荐结果没有用的数据信息 在存放到数据库之前进行删除。然后,采用 SQL Server 2007 数据库来存放获取到的用 户信息。
(3)进行标签推荐时,本文主要分析了基于 TF-IDF 与权重相结合的标签推荐算法 和基于用户交互关系的 TagRank 标签推荐算法。最后,本文又整合了这两种算法提出 了基于关注者相似度分析的微博用户标签推荐算法,经过实验验证,发现本文提出的 算法得到的推荐较以上两种算法更准确。
关键词:标签推荐,兴趣挖掘,微博,TagRank,TF-IDF
I
III
III
IV
IV
Abstract
In recent years, with the more rapid development of science and technology in China, the microblog plays a very important role in our society and life. The microblog users can send and receive large amounts of information, and can also interact with other users, to achieve real-time information, commented, transfered and other operations. Due to the enormous amount of information generated by microblog every day, how to dig out the valuable information from a large number of microblog information, is a wide range industry in the modern Internet applications. In this industry, the value of user interest feature on the dig microblog is very high. However the traditional user interest mining method can not adapt to the characteristics of microblog, so based on the existing micro-blog interest mining method ,the thesis designs a microblog users tag recommendation system which based on the similarity analysis of followers, according to the us
您可能关注的文档
- 基于光纤飞秒激光技术的相干合成获得少周期飞秒脉冲-光学工程专业论文.docx
- 基于光线投射算法的CT图像三维重建与分割剪取-计算机应用技术专业论文.docx
- 基于光纤非线性效应的波长转换的研究-光纤通信专业论文.docx
- 基于光脉动谱法的煤粉颗粒在线测量-动力机械及工程专业论文.docx
- 基于光致伸缩作动器的柔性板壳结构非接触精密控制研究机械设计及理论专业论文.docx
- 基于光脉冲辅助的金属诱导横向晶化多晶硅薄膜的研究-光学工程专业论文.docx
- 基于光谱互补的无定形梯形聚合物的三元共混本体异质结聚合物太阳能电池-材料工程专业论文.docx
- 基于光谱与视觉图像的机载式油菜生长信息检测统研究-生物系统工程专业论文.docx
- 基于光调控的有机场效应晶体管非易失性存储器的研究-光学工程专业论文.docx
- 基于光谱分析的微波加热实时检测系统研究-光学工程专业论文.docx
- 基于关注区域的图像细匹配检索方法研究-计算机科学与技术专业论文.docx
- 基于关注阶段理论的初中熟手型教师专业发展研究-课程与教学论专业论文.docx
- 基于关系图表述的Web服务组合补偿问题的研究-计算机系统结构专业论文.docx
- 基于共面波导的平面电路研究及应用-电子与通信工程专业论文.docx
- 基于关系型数据库OLAP策略的研究与实现-计算机软件与理论专业论文.docx
- 基于关系型数据库的单元测试的研究与实践-软件工程专业论文.docx
- 基于关系数据库性能优化策略的研究与实现-计算机软件与理论专业论文.docx
- 基于关系型数据库的数据切分问题研究-计算机科学与技术专业论文.docx
- 基于关系契约的大中型施工总承包企业成本绩效优化研究-工程经济与管理专业论文.docx
- 基于关系型融资的企业持股银行价值分析-财务管理专业论文.docx
文档评论(0)