基于word2vec和SVMperf的网络中文文本评论信息情感分类研究-计算机技术专业论文.docxVIP

基于word2vec和SVMperf的网络中文文本评论信息情感分类研究-计算机技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生优秀毕业论文 摘要摘要 摘要 摘要 近些年来,随着web2.0技术的产生和飞速发展,尤其是诸如电子商务、博客、 论坛、微博等许多新兴互联网平台的出现,越来越多的用户习惯于在这些网络平台 上发表自己的观点,表达自己的感受。而随着网络用户量的不断增加,产生的用户 评论数量也呈爆炸式增长,仅凭用户来翻看这些评论以获取有价值的信息,变得不 切实际。因此,一个新的用来帮助用户对海量评论进行分析甄选,从中抽取出有价 值的信息的研究方向应运而生,即“情感分类” 在情感分类研究中,用的最多的也最有效的方法是基于机器学习的方法。在基 于机器学习方法的情感分类研究中,最重要的环节是有效特征的提取。在前人的研 究中,往往只考虑了浅显的词汇特征和句法特征,而忽略了对于隐含的语义特征的 提取。针对此问题,本文主要进行了以下三个方面的研究: 1)本文利用word2vec可以获取语义联系的特性,首先对文本语料库进行了相似 特征聚类的实验,将语料库中描述同一个产品特征的词语进行了聚类,方便后续的 情感分类研究工作可以获得良好的分析总结。实验结果表明,利用word2vec可以很 好地将语料库中的相似特征提取出来,并聚合为同一产品特征簇。 2)本文提出了基于word2vec和SVMperf的中文文本情感分类研究方法。方法 利用word2vec的特性,将文本中的词汇表示为向量空间中的高维向量,通过对这些 词向量进行余弦相似度的计算,从而获得词汇之间在语义上的相似度,然后将这些 向量作为语义特征,用SVMperf分类模型进行训练,得到最终的分类结果。实验结 果表明,此方法可以获得较好的分类结果。 3)为了进一步提升分类的正确率,本文又在上述情感分类方法的基础上,在提 取特征时,考虑了否定词、程度词和转折词等上下文结构特征,再结合语义特征, 一起作为有效特征用SVMperf训练和测试。实验结果表明,结合了上下文结构特征 的情感分类方法可以获得更佳的分类效果。 最后,本文将情感分类算法与具体应用相结合,开发了一套股票分析系统。系 统主要通过对股民评论的情感指数与股票价格走势的分析对比,判断两者有无相关 性。 关键词相似特征聚类;情感分类;word2vec;SVMperf;语义特征;上下文结构特 征 万方数据 Abstract================================================== Abstract ================================================== Abstract In recent years,with the emergence and rapid development of web2.0 technology, especially the emergence of many new Internet platforms such as e_commerce,blog, forum and weibo,more and more users are accustomed to present their views and feelings on these network platforms.And with the increasing of network users,the number of user comment is exploding.Analyzing these comments in order to get valuable information only by users is impractical.As a result,a new research field which can help users to analyze and select huge comments SO as to extract valuable information emerges at the right moment,i.e.,”sentiment classification”. Within the sentiment classification,the most commonly used and effective way is the method based on machine learning.In the study of sentiment classification based on machine learning method,the most important work is the extraction of effective features. Most of the existing researc

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档