基于主题模型的网络舆情监控研究-计算机科学与技术专业论文.docxVIP

基于主题模型的网络舆情监控研究-计算机科学与技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 基于主题模型的网络舆情监控研究 论文作者签名: 指导教师签名: 论 文 评 阅 人 1 : 评阅人 2: 评阅人 3: 答辩委员会主席: 委员 1: 委员 2: 委员 3: 委员 4: 委员 5: 委员 6: 答辩日期: 年 月 日 南华大学学位论文原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得南华大学或其他单位的学 位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文 中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 作者签名: 年 月 日 南华大学学位论文版权使用授权书 本学位论文是本人在南华大学攻读(博/硕)士学位期间在导师指导下完成 的学位论文。本论文的研究成果归南华大学所有,本论文的研究内容不得以其它 单位的名义发表。本人同意南华大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部 或部分内容,可以采用复印、缩印或其它手段保留学位论文;学校可根据国家或 湖南省有关部门规定送交学位论文。同意学校将论文加入《中国优秀博硕士学位 论文全文数据库》,并按《中国优秀博硕士学位论文全文数据库出版章程》规定 享受相关权益。同意授权中国科学信息技术研究所将本学位论文收录到《中国学 位论文全文数据库》,并通过网络向社会公众提供信息服务。对于涉密的学位论 文,解密后适用该授权。 作者签名: 年 月 日 导师签名: 年 月 日 基于主题模型的网络舆情监控研究 摘要:互联网的发展让我们的生活世界成为了地球村,网络的便捷性 使人们每时每刻都能够从网络上获取信息。随着 Web2.0 技术的应用, 人们不再只是简单的获取网络上的信息,而是成为了网络消息的创造 者,同时还能够通过网络发表自己的观点看法,表达自己的情感。网 络上的信息爆炸性增长,人们在面对如此多的信息时可能会不知所 措,同时这也给我们的政府提出了一个挑战。由于网络的实时性,信 息的传播速度非常快,一件事情很快就能够被大范围的网民所知道, 尤其是一些关于社会民生的事件,更是容易引起广大网民的关注;还 有一些别有用心的人,故意在网络上散布一些虚假、敏感的信息,利 用网络水军进行大范围的传播,这很容易导致网络舆情的发生。而这 些舆情信息对于社会的和谐稳定是非常不利的。因此需要能够有效的 对网络上的舆情信息进行监控,实时掌握网络舆情信息的动态是非常 有必要的。 针对网络舆情监控,国内外都进行了大量的研究。国外对于网络 舆情认识比较早,且非常重视,现在已经形成了比较成熟的监控机制 和监控系统。但国内起步较晚,近年来才引起政府的重视,也成为了 学者研究的热点问题。国内经过这几年的努力也取得了一定的研究成 果,出现了一些网络舆情监控系统用于对互联网上的舆情信息进行实 时监控,但目前的舆情监控系统中使用监控技术主要有两种,一种是 I 基于敏感词匹配的方法,系统中提前设定一些敏感词,通过对网络上 信息进行检索匹配,如果含有这些敏感词的信息被视为舆情信息;另 一种就是基于词频统计的文本分类聚类的方法。这两种方式都取得了 一定的效果,但这两种方式都存在着一定的缺陷,它们都不是建立在 对文本内容语义信息理解的基础上进行的,以至于在准确发现舆情信 息方面存在不足。因此,本文对如何提高舆情信息发现准确度方面进 行了深入研究,尝试使用目前比较成熟的主题模型应用于舆情信息监 控系统当中,利用主题模型在语义挖掘上的优势填补上述传统方法中 的不足。本文主要内容为: 1)详细分析了传统舆情监控系统中所使用的技术,如信息采集、 信息预处理、中文文本分词、文本表示模型、文本聚类等。同时研究 了基于词频统计的舆情分析的不足。 2)提出了基于 LDA 主题模型的舆情信息分析方法,通过对文本 集进行 LDA 主题建模,发现文本中的隐含主题,提高舆情分析的准确 度。 3)基于理论分析,设计并实现了一个网络舆情监控系统,系统 实现了舆情搜索,每日舆情,热点舆情信息等功能。 关键词:网络舆情;舆情监控;主题模型;LDA II RESEARCH ON NETWORK PUBLIC OPI

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档