- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录
目 录
摘 要 I
Abstract II
目 录 IV
第一章 绪论1
§1.1 研究背景1
§1.2 研究现状2
§1.2.1 国外研究现状2
§1.2.2 国内研究现状3
§1.3 研究意义6
§1.4 研究内容6
§1.5 本文的组织结构 7
第二章 文本分类概述9
§2.1 基本概念9
§2.2 文本分类系统10
§2.2.1 特征提取 10
§2.2.2 分类器学习 11
§2.2.3 分类器评价 12
§2.3 文本分类技术13
§2.3.1 特征提取技术13
§2.3.2 分类器学习技术15
§2.3.3 分类技术应用16
§2.4 本章小结18
第三章 情感分析概述19
§3.1 基本概念19
§3.2 情感层次划分20
§3.3 情感和主观性分类 21
§3.3.1 文档级情感分类21
§3.3.2 句子级主观性和情感分类 22
IV
目录
§3.3.3 情感词典构建22
§3.4 情感检索23
§3.5 本章小结25
第四章 基于自扩展思想的情感词典构建26
§4.1 问题提出26
§4.2 相关知识概述27
§4.3 情感词获取及评分方法28
§4.3.1 模式发现 28
§4.3.2 情感词获取 29
§4.3.3 情感词评分 29
§4.3.4 算法描述 30
§4.4 算法性能评估与分析32
§4.5 本章小结34
第五章 基于SO-CAL 的中文情感分析方法35
§5.1 问题提出35
§5.2 相关知识概述35
§5.3 基于 SO-CAL 的情感分析 37
§5.3.1 新情感词的倾向评定37
§5.3.2 强弱化式处理40
§5.3.3 否定式处理 41
§5.4 算法性能评估与分析43
§5.4.1 EM-SO 的性能评估43
§5.4.2 否定式及强化式组件性能评估44
§5.5 本章小结45
第六章 总结与展望46
§6.1 全文总结46
§6.2 工作展望47
参考文献48
致谢52
攻读硕士期间参加的科研与发表论文53
V
第一章 绪论
第一章 绪论
§1.1 研究背景
当今世界的文本信息大致能够分为两类:事实和观点。事实是实体、事件及其
属性的客观表达。观点通常是人类针对特定主体、事件及其属性的情感、感觉和评
价的主观表达,观点的概念非常宽泛。在本文中,只专注于能够传达人们积极或消
极情感的观点表述。大多现有的文本信息研究工作致力于检索和挖掘显示信息,如
信息检索、网络搜索、文本分类、文本聚类以及其他的文本挖掘和自然语言处理任
务。至今,仍只有很少一部分研究工作是针对观点进行处理的,然而观点的重要性
毋庸置疑,无论是对于个人还是集体而言,在需要做出决策时我们想要听到更多他
人的观点和主张。
缺乏针对观点挖掘研究的主要原因之一是在互联网时代之前只有很少具有观
点性质的文本信息供人们参阅,当一个人需要做出决策时,他 (她)通常都是从朋
友或家人处获取
文档评论(0)