- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网舆情监控分析系统的研究与实现-软件工程专业论文
万方数据
万方数据
分类号 密级
UDC 注 1
学 位 论 文
互联网舆情监控分析系统的研究与实现
(题名和副题名)
刘德鹏
(作者姓名)
指导教师姓名 徐 谡 研究员
电子科技大学
成
都
许慧新
高
工
浙江省公安厅行技总部 杭 州
(职务、职称、学位、单位名称及地址) 申请专业学位级别 硕士 专业学位类别 工 程 硕 士
工程领域名称 软 件 工 程
提交论文日期 2011.03.25 论文答辩日期 2011. 04.30 学位授予单位和日期 电 子 科 技 大 学 答辩委员会主席
评阅人
年 月 日
注 1:注明《国际十进分类法 UDC》的类号
独 创 性 声 明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示谢意。
签名: 日期: 年 月 日
关于论文使用授权的说明
本学位论文作者完全了解电子科技大学有关保留、使用学位论 文的规定,有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位 论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后应遵守此规定) 签名: 导师签名:
日期: 年 月 日
摘要
摘 要
随着互联网的高速发展,网络给人们提供了前所未有的开放、便捷的信息共 享与发布平台,越来越多的人通过网络来表达自己的意见、想法、情绪和态度, 其中既包括对对事件的发展有着正面、积极作用的信息,也包括一些负面、消极 的信息。同时,网络平台的开放性、直接性和隐蔽性使得网络舆论越来越重要地 影响人们的意识形态。因此,对大量舆情信息的及时有效监控分析,对维护社会 稳定、促进国家发展具有重要的现实意义。
网络舆情监控系统与自然语言处理技术密切相关。受限于自然语言处理技术 水平,传统的网络舆情监控系统,主要为话题识别的相关内容,而对舆情的情感 因素关注较少。虽然也有学者对舆情情感意见信息挖掘进行了研究,但由于处理 结果与语料相关性较高,导致实用性不足。
近年来,随着自然语言处理研究的逐步深入,浅层语义分析开始崭露头角, 并在相关应用研究中体现出相对词性标注、句法分析更为智能实用的优势。浅层 语义分析是一种简化了的语义分析形式,它利用动词对句意理解的关键作用,以 动词为中心对句子意义的进行了形式化表示。语义角色标注作为一种浅层语义分 析,对句子中一些成分为给定动词谓词的语义角色进行了标注,具有分析任务定 义明确、便于评价等优点。
结合这种最新的自然语言处理技术,基于对现有舆情监控分析算法的对比分 析,我们设计并实现了一个网络舆情监控分析系统,创新性的提出了:(1)一种 新的结合 HowNet 中公开的计算词语语义相似性算法和基于字的倾向计算算法, 并对现有话题识别与追踪技术进行优化整合;(2)通过对大量样本的统计分析, 得到倾向性语言表现形态规律,具体表现为角色-特征性概率表和角色-情感性概 率表,为后续分析提供客观数据基础。
本文包括的主要内容有:
(1)舆情监控分析系统框架设计与模块设计。根据网络舆情信息的特点,提 出系统总体框架,并对信息预处理模块、信息挖掘模块和信息服务模块进行了设 计。
(2)舆情热点话题识别技术研究。对网络中一段时间内大量出现的某个新闻
I
摘要
主体进行提取追踪,通过对 ICTCLAS 分词技术、文档频率特征抽取方法、TFIDF
权重计算以及 K 均值聚类算法的有效整合,实现热点话题识别与追踪。
(3)舆情信息浅层语义分析研究。主要利用语义角色标注工具,通过训练测 试,对文本语义层角色进行标注。
(4)舆情信息倾向分析研究。实现文本中意见、情感等信息的提取,主要包 括情感词库建设、特征库建设、情感倾向计算算法研究以及语料知识发现等。
本文所涉工作在国内相关事件和分析中得到应用,可有效辅助舆情监控并减 少人为干预,必将在未来的网络信息管理中发挥积极的效益。
关键词:网络舆情;监控分析;热点识别;文本倾向分析;语义角色标注
II
Abatract
Abstract
Along with the rapid development of the Internet, network provides people with unprecedentedly open, convenient platform for information sharing and releasing.
您可能关注的文档
- 华能北京热电厂营销策略研究-工商管理专业论文.docx
- 互联网行政立法研究-宪法与行政法学专业论文.docx
- 基因芯片原位合成新材料和结果分析新方法研究-物理化学专业论文.docx
- 华立公司绩效管理方案设计-工商管理专业论文.docx
- 侯马北站驼峰存在的问题及对策-交通运输工程专业论文.docx
- 厚层抗蚀剂成像特性研究-光学专业论文.docx
- 华光集团薪酬解决方案-工商管理(mba)专业论文.docx
- 华北油田油气断块经济开发方法-工业工程专业论文.docx
- 基因芯片对胃癌、食管癌和贲门癌基因表达谱的对比研究-微生物学专业论文.docx
- 华能珞璜电厂w火焰锅炉低负荷稳燃试验研究-动力工程专业论文.docx
- 互花米草富集盐腺细胞转录组测序分析及耐盐相关基因的克隆与鉴定-海洋生物学专业论文.docx
- 基于android平台的nfc终端设计-电子与通信工程专业论文.docx
- 厚膜钢基板功率电阻器技术研究-仪器仪表工程专业论文.docx
- 基因的专利保护问题-法律专业论文.docx
- 基于ansys宽幅面砂光机磨削系统的分析研究机械工程专业论文.docx
- 互文性研究对高中英语阅读教学的指导作用-学科教学·英语专业论文.docx
- 基于arcgis engine的三维地理信息系统开发及应用-大地测量学与测量工程专业论文.docx
- 基于“性状”和化学成分的清蒸九制地黄过程研究-药剂学专业论文.docx
- 互联骨干网互联与网络价值关系研究-管理科学与工程专业论文.docx
- 互动式教学在小学美术教学中的实践与探索-学科教学·美术专业论文.docx
最近下载
- DM.03 ×× U9 ERP项目-实施备忘-年月日.doc VIP
- DM.16.01 ××U9 ERP项目培训计划书.docx VIP
- DM.01 ×× U9 ERP项目-项目章程.pptx VIP
- 理论力学(第9版)(I)习题答案解析.pdf
- 公司片区经理竞聘演讲与公司物业半年工作总结合集.doc VIP
- DM.18 ×× U9 ERP项目-阶段汇报.pptx VIP
- 建筑结构抗震设计05(PPT81页).pptx VIP
- 【完整版】IATF16949-2016内审检查表(按过程方法编制).docx VIP
- 贸易公司的授信管理.pptx VIP
- 中国建筑第八工程局有限公司安全管理制度汇编 .doc VIP
原创力文档


文档评论(0)