- 1、本文档共86页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于句子情感权值合成算法的篇章情感分析计算机科学与技术专业论文
优秀毕业论文
精品参考文献资料
声
声 明
本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文 不包含其他个人或集体已经发表或撰写过的研究成果。对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的 法律责任由本人承担。
论文作者签名: 因啦: 日期: 幺里堕:鱼:仝.
关于学位论文使用权的说明
本人完全了解太原理工大学有关保管、使用学位论文的规定,其 中包括:①学校有权保管、并向有关部门送交学位论文的原件与复印 件;②学校可以采用影印、缩印或其它复制手段复制并保存学位论文;
③学校可允许学位论文被查阅或借阅;④学校可以学术交流为目的, 复制赠送和交换学位论文;⑤学校可以公布学位论文的全部或部分内 容(保密学位论文在解密后遵守此规定)。
签 名: 因.盟曼: Et I莓I: 是!妄:鱼:旦.
导师签名:
万方数据
太原理工大学硕士研究生学位论文基于句子情感权值合成算法的篇章情感分析
太原理工大学硕士研究生学位论文
基于句子情感权值合成算法的篇章情感分析 摘要
随着互联网的蓬勃发展,越来越多的人通过微博、论坛、朋友圈等网 络社区发表自己对当前一些热点事件的看法,消费者也频繁地通过网络发 表自己对一些商品的意见,这些包含用户主观情感的评论性文本直接反映 了用户的真实想法,因而对其进行有效的分析具有巨大的社会和商业价值。 人工处理规模庞大的网络文本数据需要耗费巨大的人力物力,而借助高性 能的计算机技术来处理庞大的网络文本可以大大增加效率,通过计算机对 文本进行情感分析可以快速有效地提取出其中包含的有用信息。传统的文 本情感分析主要针对词、短语、句子等进行研究,而对于篇幅较长的文本 所做研究相对匮乏,而且对汉语中多种特殊的复杂句式结构缺乏足够有效 的分析,所以本文就将篇幅较长的篇章级文本作为主要研究对象,并着重 分析各种中文复杂句式,最终提出了一种基于句子情感权值合成算法的文 本情感分析方法,对篇幅较长的中文文本能够进行有效的情感分析。
研究中主要进行了以下工作:首先,词语的良好识别是进行后续研究 的关键。研究中,为了更好的识别各种相关词语,在已有资源的基础上, 构建了情感词典、关联词表、否定词表、总结词表、程度副词表等,在分 词时融入构建好的各种词典以提高分词精度。其次,对传统的朴素贝叶斯 文本分类算法进行了详细的分析,并对其进行了一定程度的改进,将改进 后的算法应用于简单旬的情感分析,并与原算法进行实验对比。再次,充 分分析了汉语中多种复杂句式的特殊旬式结构,复杂句中往往会出现多种 语义共现的情况,利用传统的文本分类方法难以较好的分析复杂句的情感, 所以根据关联词、否定词、情感词的不同组合规律,为复杂句式的情感分 析设计了相应的情感分析规则。最后,在分析篇幅较长的中文文本时,首 先将整篇文本细化为句子的集合,对简单句和复杂句分别采取相应的情感 分析方法。在得到每个句子的情感之后,根据句子中的一些影响句子情感 的特殊因素,比如程度副词、句子类型、句子位置等,为每个句子赋予相 应的情感权值。在得到所有句子的情感权值之后,依据句子情感权值合成 算法计算得出整篇文本的最终情感。
在利用公开数据集所展开的实验中,改进后的朴素贝叶斯算法相对于
T
万方数据
太原理工大学硕士研究生学位论文改进前获得了更高的分析精度;利用新提出的情感分析规则对复杂句式进
太原理工大学硕士研究生学位论文
改进前获得了更高的分析精度;利用新提出的情感分析规则对复杂句式进 行情感分析,要比传统的文本分类算法拥有更好的分析效果;利用新提出 的句子情感权值合成算法对三种不同类别的文本进行情感倾向性分析时, 平均准确率分别达到了80.6%、81.4%、74.6%,平均召回率分别达到了80.1%、 82%、77.2%,而利用传统的文本分类算法对其进行情感分析时,平均准确 率分别为73.4%、76.2%、70.5%,平均召回率分别为76.1%、78.3%、72.3%。 实验结果证明,利用句子情感权值合成算法可以较好地分析篇章级文本的 情感倾向性,并且比传统的文本分类算法拥有更高的效率。
关键词:情感倾向性,简单句,朴素贝叶斯,复杂句,情感权值
万方数据
太原理工大学硕士研究生学位论文DOCUMENT
太原理工大学硕士研究生学位论文
DOCUMENT SENTIMENT ANALYSIS BASED ON SENTENCE SENTIMENT WEIGHT SYNTHESIS ALGORITHM
ABSTRACT
Along with the vigorous development of the internet,more and more people express their v
您可能关注的文档
- 电流互感器多频率同步信号的谱分析方法研究仪器仪表工程专业论文.docx
- 股二头肌长头h反射的研究外科学骨科专业论文.docx
- 北京市东城区育龄妇女避孕节育知情选择现况调查流行病与卫生统计学专业论文.docx
- 大学新生宿舍人际关系提升研究思想政治教育专业论文.docx
- 磁悬浮直线运动系统的设计与控制研究机械工程专业论文.docx
- 复杂环境下我国国际工程承包企业发展态势及策略研究工程管理专业论文.docx
- 高速铁路线路空间线形的轮轨动力学评价指标研究交通运输工程专业论文.docx
- 蚕蛹蛋白源ace抑制多肽的结构鉴定及抑制机理研究化学工艺专业论文.docx
- 城市轨道交通换乘站设施协调分析交通运输规划与管理专业论文.docx
- 城市公园景观视觉评价研究城市规划与设计专业论文.docx
- PDM软件:Siemens Teamcenter二次开发_(17).Teamcenter最佳实践与案例分析.docx
- SCADA软件:GE Proficy二次开发_(4).Proficy开发环境搭建.docx
- 智能电表软件:Landis+Gyr智能电表二次开发_(13).系统集成与测试.docx
- 智能电表软件:Elster智能电表二次开发_(8).Elster智能电表二次开发环境搭建.docx
- PDM软件:Siemens Teamcenter二次开发_(11).TeamcenterAPI与编程基础.docx
- SCADA软件:GE Proficy二次开发_(7).报警与事件管理.docx
- 智能电表软件:Echelon智能电表二次开发_(11).智能电表行业标准与法规.docx
- 智能电表软件:Itron智能电表二次开发_(6).用户界面定制与开发.docx
- 智能电表软件:Elster智能电表二次开发_(9).Elster智能电表二次开发工具使用.docx
- PDM软件:PTC Windchill二次开发_(21).Windchill最佳实践案例分析.docx
文档评论(0)