基于Word2Vec的微博情感新词识别与倾向判断研究-信息安全与电子商务专业论文.docxVIP

基于Word2Vec的微博情感新词识别与倾向判断研究-信息安全与电子商务专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3)结合词共现与词向量相似度识别情感词。基于词共现识别情感词与 3)结合词共现与词向量相似度识别情感词。基于词共现识别情感词与 基于词向量相似度识别情感词是两种不同的思想。前者依据词语分别与正 面种子词和负面种子词共现的频率来判断词语倾向,后者利用词语上下文 的语境将其转化为向量形式,再根据词语与基础情感词的近义关系判断词 语倾向。本文把两种情感词识别方法结合起来,以基于词向量的方法为主, 以基于词共现的方法为辅,过滤低频词和低可信度的结果,对冲突结果采 用线性加权处理,在保证正确率的同时,寻求识别更多的情感新词。 综上所述,本文将对大规模微博语料进行分析,首先利用词向量工具, 根据词语与基础情感词的近似关系,提出一套情感新词识别与倾向判断方 案。然后,将两种不同的情感词识别与倾向判断的思想结合,更全面有效 的识别微博情感新词。 关键词:词向量词语相似度词共现情绪识别 lI 万方数据 The The Research of Micro—Blog New Emotion Words Recognition and Orientation Judgment Based on Word2Vec AB STRACT In this information explosion era,network texts can reflect a lot of Internet users’emotions,views and opinions.Analysis of these texts Can timely understand public opinion and guide its orientation for the government.For enterprises,it can timely find their own problems and improve their servic.es. But the commonly used emotional dictionary now can not cover all the common emotional words.Micro—blog and other new media be more and more popular, which resulting in fragmentation of the network language,new words continue to generate and spread.It brought lots of difficulties to the emotional analysis of Internet texts. This article will be based on the recognition of new emotion words witch dose not contains in the emotion dictionary and to determine their emotional tendencies.The main research contents are as follows: 1)Pretreatmentofmicro—blogdataandemotionalwordsidentification.In order to ensure the accuracy of recognition of emotional words and recognition more emotional words,we formulated the data cleaning program,new word identification scheme,construction emoticons sentiment lexicon. 2)Words’similarity calculate and emotion words recognition based on Word Vector.The word vector is a method of representing the words in the text m 万方数据 into into the form of the space vector.In the process of transformation,it considered the relationship between words and context,which can keep more natural language information.We used Word2Vec to convert words to Word Vect

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档