- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网信息情感倾向性的研究与实现-计算机软件与理论专业论文
独创性(或创新性)声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名: 日期
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密的论文 在解密后遵守此规定)
本学位论文属于保密,在 年解密后适用本授权书。
本人签名: 日期
导师签名: 日期
摘 要
近年来,互联网信息资源急剧膨胀,带有个人情感色彩的言论越来越多,分 析这些文本有着很大的现实意义,因此如何有效地抽取与过滤互联网上的信息, 如何对文本进行情感倾向分析成为当前互联网智能信息处理的研究热点。这涉及 到自然语言处理、信息检索、信息抽取、机器学习等多个领域的研究内容。
本文首先介绍了研究的背景以及相关的理论基础,而后,详细地研究了从互 联网信息抽取到情感倾向分析的一个完整的流程,主要是三个方面:互联网信息
抽取、信息过滤、文本倾向分析。在信息抽取中,主要分析了互联网信息的结构, 应用了 DOM 树、HTML 解析器处理网页数据,引入了模板技术以解决多样化的网 页信息抽取。在信息过滤部分,在词语语义相似度计算基础上,近一步改进了句 子的语义相似度计算算法;最后,研究了文档之间相似度计算的方法,并通过文 档与主题之间的相似度值来实现文本信息的过滤。此后部分,深入研究了文本的
倾向性计算算法,涉及短语的倾向性计算、句子及篇章的倾向性计算。在此基础 上,阐述了一个互联网信息倾向性分析系统的设计与实现。
最后,通过实验验证了信息抽取的可行性、改进的信息过滤算法的高效性以 及倾向性分析算法的准确性,同时对互联网信息倾向性分析系统进行了功能测试, 实验证明系统达到了设计要求。
关键词:信息抽取 信息过滤 情感倾向
Abstract
In recent years, internet information expand rapidly. There are more and more remarks with personal feeling. Analysis of these texts is of great practical significance, So how to effectively extract and accurately filter information on the Internet, and how to analyze the sentiment orientation analysis of text have become research hot spots of current internet intelligent information processing. This involves natural language processing, information retrieval, information extraction, machine learning and so on.
In this paper, it firstly introduces the research background and theoretical foundation, then a complete process from the extraction of internet information to the analysis of sentiment orientation is studied in detail, including internet information extraction, text filtering, text sentiment orientation analysis. In information extraction, it mainly analyzes the structure of internet information, applies the DOM tree and HTML pars
您可能关注的文档
- 华中科技大学学生社团管理的问题与对策-公共管理专业论文.docx
- 基于arm的脉冲变压器数据采集与分析-计算机应用技术专业论文.docx
- 基于arm的多功能控制器在智能家居中的研究-物理电子学专业论文.docx
- 基于aqm的可信网络拥塞控制研究-电路与系统专业论文.docx
- 基因组dna及gstp1基因甲基化修饰与燃煤污染型砷中毒关系探讨-卫生毒理学专业论文.docx
- 基于android移动终端的电子提花机远程控制系统的研究与实现-计算机技术专业论文.docx
- 基因组gc含量与碱基、密码子和氨基酸使用偏好的关系-生物医学工程专业论文.docx
- 互惠lotka-volterra生态系统捕获优化问题-应用数学专业论文.docx
- 基于arcengine的土地利用数据综合方法分析-地图制图学与地理信息工程专业论文.docx
- 华亭煤自燃特性的实验分析-安全技术及工程专业论文.docx
最近下载
- 露天矿采矿与剥离作业规程.pdf VIP
- 电大国家开放大学《政府经济学》(本)2025-2026期末试题及答案2025.pdf VIP
- 第27课 定速巡航的控制 教案 义务教育人教版信息科技六年级全一册.docx VIP
- 幼儿园美术教案《沙漠里的树》植树节主题活动PPT课件.doc VIP
- Java基础知识大全单选题100道及答案.docx VIP
- 工匠精神精品课件.pptx
- 25《带上她的眼睛》课件(共45张PPT).pptx
- 上海海事大学2021-2022年《货币银行学》期末考试试卷(A卷)含参考答案.docx
- 2024年福建省中考化学真题试卷(含答案).docx VIP
- 风电场并网测试方案.docx
文档评论(0)