- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
Dissertation Submitted to Hangzhou Dianzi University for the Degree of Master
The Research of Chinese Sentiment Classification Method Based on Topic Model
Candidate: Li Qiang Supervisor: Prof. Wu Ting
March,2016
杭州电子科技大学
学位论文原创性声明和使用授权说明
原创性声明
本人郑重声明: 所呈交的学位论文,是本人在导师的指导下,独立进行研 究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人 或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集 体,均已在文中以明确方式标明。
申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 日期: 年 月 日
学位论文使用授权说明
本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文 在解密后遵守此规定)
论文作者签名: 日期: 年 月 日
指导教师签名: 日期: 年 月 日
杭州电
杭州电子科技大学硕士学位论文
摘 要
随着“互联网+”的互联网形态逐步演化发展,网络正逐渐充斥着人们生活 的方方面面,人们越来越多的在网络上表达着自己对事物的看法,从一部电影, 一个商品到社会热点事件的评论,主观性文本充斥着整个网络。对这些主观性文 本的情感倾向的研究,有利于分析消费者的态度,也可以研究大众的情感变化, 有着重大的现实意义。因此自然语言的情感分类问题,一直是文本处理领域的热 点问题。
情感分类问题有如此重大的理论和现实意义,基于此,本文主要做了以下研 究工作。
首先,本文详细介绍了研究情感分类问题使用的主要技术,并系统性的阐述
了文本表示模型的发展演化过程,从最初的 VSM 模型到基于潜在语义的 LSA 模 型和 PLSA 模型,重点介绍了 LDA(隐狄利克雷分布)模型,包括该模型的原
理、生成过程和参数推导过程,以及其在情感分类中的一些具体应用,可知将
LDA 模型引入情感分类任务是可行并且有不错的效果。
其次,针对 LDA 模型中主题特征质量有差异的问题,本文提出一种基于主 题加权的 LDA 模型的情感分类方法。介绍了一种基于神经网络获取词向量的方
法,以此词向量计算词语相关度,并计算出主题的内部相关度,进而转化为主题 维度上的权值,将加权后的文本-主题分布进行训练分类。实验显示,本文方法
比经原始 LDA 模型建模的文本分类效果提升 5%,证明本文方法的有效性。
最后,本文寻求一种无监督的情感分类方法,以降低人工标注的成本。本文 借助 HowNet 计算词语的情感值,依旧使用 LDA 模型对语料建模,可以无监督
地获取文档-主题分布和主题-词语分布,通过主题下分布概率较高的词语的情感
值,计算主题的情感分布,再加上主题加权的算法,进一步计算得到文档的情感 分布。整个过程是无监督的,实验显示,本分类方法可以达到不错的效果,且本
方法是无监督的,因此本方法有一定的研究意义。
关键词:情感分类,主题模型,特征加权,无监督分类,中文信息处理
I
ABSTRACT
With the evolutionary development of the Internet +”, all aspects of peoples living is gradually filled with network, more and more people express their views in the Internet. Subjectivity documents about a movie, a commodity, a hot topic of the society and so on are inundated with the entire Internet. Researching these subjective documents’s emotional tendencies is of great practical sign
您可能关注的文档
- 基于主动测量的网络性能分析-计算机系统结构专业论文.docx
- 基于主动网的自适应入侵响应系统的研究与实现-计算机应用技术专业论文.docx
- 基于主动红外热成像的倒装焊缺陷检测方法研究-机械制造及其自动化专业论文.docx
- 基于主动网技术的分布式数据库系统研究-计算机应用技术专业论文.docx
- 基于主动网络技术的可靠组播协议研究-计算机软件与理论专业论文.docx
- 基于主动网络技术的网络管理模型研究-计算机软件与理论专业论文.docx
- 基于主动脉舒张性能的艳山姜活性部位的研究-药剂学专业论文.docx
- 基于主动视觉的二维精密检测系统的研制-机械电子工程专业论文.docx
- 基于主动视觉的智能车导航系统研究-控制理论与控制工程专业论文.docx
- 基于主动网络技术的可靠组播协议-计算机软件与理论专业论文.docx
- 基于主题模型的动态场景分类-软件工程专业论文.docx
- 基于主题模型的企业微博推荐方法研究与实现-软件工程专业论文.docx
- 基于主题模型的主题演化分析及预测-信息安全专业论文.docx
- 基于主题模型的交通数据流可视化分析-计算机应用技术专业论文.docx
- 基于主题模型的汉语动词隐喻识别方法研究-计算机软件与理论专业论文.docx
- 基于主题模型的文本挖掘的研究-计算机应用技术专业论文.docx
- 基于主题模型的网络舆情监控研究-计算机科学与技术专业论文.docx
- 基于主题模型的舆情分析子系统研究与设计-计算机应用技术专业论文.docx
- 基于主题模型与泊松因子分析的股票市场情绪分析-集成电路工程专业论文.docx
- 基于主题的Web信息采集技术研究-计算机软件与理论专业论文.docx
原创力文档


文档评论(0)