基于主题模型的网络舆情监控研究-计算机科学与技术专业论文.docxVIP

下载本文档

3
0
约4.19万字
约 73页
2019-04-19 发布于上海
举报
版权申诉

基于主题模型的网络舆情监控研究-计算机科学与技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

万方数据万方数据基于主题模型的网络舆情监控研究论文作者签名: 指导教师签名: 论文评阅人 1 ：评阅人 2：评阅人 3：答辩委员会主席：委员 1：委员 2：委员 3：委员 4：委员 5：委员 6：答辩日期：年月日南华大学学位论文原创性声明本人声明，所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了论文中特别加以标注和致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得南华大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。作者签名：年月日南华大学学位论文版权使用授权书本学位论文是本人在南华大学攻读（博/硕）士学位期间在导师指导下完成的学位论文。本论文的研究成果归南华大学所有，本论文的研究内容不得以其它单位的名义发表。本人同意南华大学有关保留、使用学位论文的规定，即：学校有权保留学位论文，允许学位论文被查阅和借阅；学校可以公布学位论文的全部或部分内容，可以采用复印、缩印或其它手段保留学位论文；学校可根据国家或湖南省有关部门规定送交学位论文。同意学校将论文加入《中国优秀博硕士学位论文全文数据库》，并按《中国优秀博硕士学位论文全文数据库出版章程》规定享受相关权益。同意授权中国科学信息技术研究所将本学位论文收录到《中国学位论文全文数据库》，并通过网络向社会公众提供信息服务。对于涉密的学位论文，解密后适用该授权。作者签名：年月日导师签名：年月日基于主题模型的网络舆情监控研究摘要：互联网的发展让我们的生活世界成为了地球村，网络的便捷性使人们每时每刻都能够从网络上获取信息。随着 Web2.0 技术的应用，人们不再只是简单的获取网络上的信息，而是成为了网络消息的创造者，同时还能够通过网络发表自己的观点看法，表达自己的情感。网络上的信息爆炸性增长，人们在面对如此多的信息时可能会不知所措，同时这也给我们的政府提出了一个挑战。由于网络的实时性，信息的传播速度非常快，一件事情很快就能够被大范围的网民所知道，尤其是一些关于社会民生的事件，更是容易引起广大网民的关注；还有一些别有用心的人，故意在网络上散布一些虚假、敏感的信息，利用网络水军进行大范围的传播，这很容易导致网络舆情的发生。而这些舆情信息对于社会的和谐稳定是非常不利的。因此需要能够有效的对网络上的舆情信息进行监控，实时掌握网络舆情信息的动态是非常有必要的。针对网络舆情监控，国内外都进行了大量的研究。国外对于网络舆情认识比较早，且非常重视，现在已经形成了比较成熟的监控机制和监控系统。但国内起步较晚，近年来才引起政府的重视，也成为了学者研究的热点问题。国内经过这几年的努力也取得了一定的研究成果，出现了一些网络舆情监控系统用于对互联网上的舆情信息进行实时监控，但目前的舆情监控系统中使用监控技术主要有两种，一种是 I 基于敏感词匹配的方法，系统中提前设定一些敏感词，通过对网络上信息进行检索匹配，如果含有这些敏感词的信息被视为舆情信息；另一种就是基于词频统计的文本分类聚类的方法。这两种方式都取得了一定的效果，但这两种方式都存在着一定的缺陷，它们都不是建立在对文本内容语义信息理解的基础上进行的，以至于在准确发现舆情信息方面存在不足。因此，本文对如何提高舆情信息发现准确度方面进行了深入研究，尝试使用目前比较成熟的主题模型应用于舆情信息监控系统当中，利用主题模型在语义挖掘上的优势填补上述传统方法中的不足。本文主要内容为： 1）详细分析了传统舆情监控系统中所使用的技术，如信息采集、信息预处理、中文文本分词、文本表示模型、文本聚类等。同时研究了基于词频统计的舆情分析的不足。 2）提出了基于 LDA 主题模型的舆情信息分析方法，通过对文本集进行 LDA 主题建模，发现文本中的隐含主题，提高舆情分析的准确度。 3）基于理论分析，设计并实现了一个网络舆情监控系统，系统实现了舆情搜索，每日舆情，热点舆情信息等功能。关键词：网络舆情；舆情监控；主题模型；LDA II RESEARCH ON NETWORK PUBLIC OPI