基于可信度评测的话题发现方法-软件工程专业论文.docxVIP

基于可信度评测的话题发现方法-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 分类号: 密级: U D C : 编号: 专业硕士学位论文 (工程硕士) 基于可信度评测的话题发现方法 硕士研究生 :李兴冠 指 导 教 师 :杨静 教授 学 位 级 别 :工程硕士 学科、专业 :软件工程 所 在 单 位 :计算机科学与技术学院 论文提交日期 :2014 年 4 月 论文答辩日期 :2014 年 6 月 学位授予单位 :哈尔滨工程大学 Classified Index: U.D.C: A Dissertation for the Professional Degree of Master (Master of Engineering) Finding Topic Based on Evaluation the Credibility Candidate: Li Xingguan Supervisor: Prof. Yang Jing Academic Degree Applied for: Master of Engineering Specialty: Software Engineering Date of Submission: April, 2014 Date of Oral Examination: June ,2014 University: Harbin Engineering University 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。 有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注 明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文 的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声 明的法律结果由本人承担。 作者(签字): 日期: 年 月 日 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作 的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送 交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进 行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的 全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一 署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文(□在授予学位后即可 □在授予学位12个月后 □解密后)由哈尔滨工程 大学送交有关部门进行保存、汇编等。 作者(签字): 导师(签字): 日期: 年 月 日 年 月 日 基于可信度评测的话题发现方法 摘 要 凭借创新式的信息生产机制和网络传播机制,微博平台成为社会热点重要的发源地 和传播途径,这使得热点话题发现技术不断研究与发展。然而,由于微博的匿名性以及 即时性等特征,使得一些人为编造的不可信话题同时在网上流传开来。于是,对于微博 信息的可信度的研究就显得至关重要,这不仅影响着整个网络的舆论导向,更影响着社 会的安定和谐。 在以往的可信度研究中,都是基于一些已有的热点话题进行可信度评测,最后验证 该话题的置信值与现实情况的对比。然而,一些不可信的话题已经作为网络的热点传播 开来,并不能从源头上阻止这些话题的传播。因此,本文结合话题发现的相关方法、微 博信息的特征并结合可信度相关的研究提出了一种基于可信度评测的话题发现方法。 本文首先提出了可信热点话题的概念,通过对可信热点话题的定义、评测指标,构 架了可信热点话题的发现框架。在框架中,主要包括用户可信度评测、微博数据准备、 话题提取、可信热点话题获取。在用户可信度评测算法中,本文不仅考虑用户的基本属 性对用户可信度的影响,还提出了一种利用相对可信度来分配用户可信度的算法。在微 博信息预处理过程中,本文考虑到时间对于一个事件的重要性,把时间作为了文本相似 度计算中的一个重要因素。最后本文基于 Single-Pass 算法进行了文本向量聚类,把聚类 得到的话题,按照可信热点话题评价指标,进行评价得到可信热点话题。 最后,本文利用微博平台上的数据对本文中提到的用户可信度评测算法、时间因素 对热点话题的影响、可信热点话题的 TDT 检测指标进行了实验。实验中用户可信度评 测算法与传统的 PageRank 算法作了比较、热点话题时间因素与非热点话题时间因素的 比较、用户可信度话题发现算法与 SPHA 算法比较,验证了本文提出的基于可信度评 测的话题发现方法在话题发现过程中的准确性以及效率。 关键词:微博;话题发现;可信度;Single-Pass;可信热点话题 哈尔滨工程大学硕士学位论文 基于可信度评测的话题发现方法 Abstract With in

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档