- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3)结合词共现与词向量相似度识别情感词。基于词共现识别情感词与
3)结合词共现与词向量相似度识别情感词。基于词共现识别情感词与 基于词向量相似度识别情感词是两种不同的思想。前者依据词语分别与正 面种子词和负面种子词共现的频率来判断词语倾向,后者利用词语上下文 的语境将其转化为向量形式,再根据词语与基础情感词的近义关系判断词 语倾向。本文把两种情感词识别方法结合起来,以基于词向量的方法为主, 以基于词共现的方法为辅,过滤低频词和低可信度的结果,对冲突结果采 用线性加权处理,在保证正确率的同时,寻求识别更多的情感新词。
综上所述,本文将对大规模微博语料进行分析,首先利用词向量工具, 根据词语与基础情感词的近似关系,提出一套情感新词识别与倾向判断方 案。然后,将两种不同的情感词识别与倾向判断的思想结合,更全面有效 的识别微博情感新词。
关键词:词向量词语相似度词共现情绪识别
lI
万方数据
The
The Research of Micro—Blog New Emotion Words Recognition and
Orientation Judgment Based on Word2Vec
AB STRACT
In this information explosion era,network texts can reflect a lot of Internet users’emotions,views and opinions.Analysis of these texts Can timely understand public opinion and guide its orientation for the government.For
enterprises,it can timely find their own problems and improve their servic.es. But the commonly used emotional dictionary now can not cover all the common emotional words.Micro—blog and other new media be more and more popular,
which resulting in fragmentation of the network language,new words continue
to generate and spread.It brought lots of difficulties to the emotional analysis of
Internet texts.
This article will be based on the recognition of new emotion words witch dose not contains in the emotion dictionary and to determine their emotional tendencies.The main research contents are as follows:
1)Pretreatmentofmicro—blogdataandemotionalwordsidentification.In order to ensure the accuracy of recognition of emotional words and recognition more emotional words,we formulated the data cleaning program,new word identification scheme,construction emoticons sentiment lexicon.
2)Words’similarity calculate and emotion words recognition based on
Word Vector.The word vector is a method of representing the words in the text m
万方数据
into
into the form of the space vector.In the process of transformation,it considered the relationship between words and context,which can keep more natural language information.We used Word2Vec to convert words to Word Vect
您可能关注的文档
- 基于Windows的DICOM标准的研究与实现-控制理论与控制工程专业论文.docx
- 基于Windows的IPSec VPN穿越NAT技术研究与实现-计算机软件与理论专业论文.docx
- 基于Windows的PC监控软件的设计与实现软件工程专业论文.docx
- 基于Windows的SIEMENS计算机并行通讯研究及模型试验环境建立-控制理论与控制工程专业论文.docx
- 基于Windows的USB接口加密系统设计与实现-电子与通信工程专业论文.docx
- 基于Windows的个人防火墙的设计与实现-软件工程专业论文.docx
- 基于WINDOWS的激光电源控制系统的研究-电子与通信工程专业论文.docx
- 基于Windows的软PLC系统开发-机械电子工程专业论文.docx
- 基于Windows的软PLC研究与开发-机械制造及其自动化专业论文.docx
- 基于Windows的压铸机控制系统的分析-电力电子与电力传动专业论文.docx
- 基于word2vec和SVMperf的网络中文文本评论信息情感分类研究-计算机技术专业论文.docx
- 基于WordNet本体库的文本分类方法-计算机应用技术专业论文.docx
- 基于WordNet的本体匹配算法研究与实现-计算机技术专业论文.docx
- 基于WordNet的艺术教育检索服务平台设计与实现-软件工程专业论文.docx
- 基于WordNet的英语隐喻自动处理研究-英语语言文学专业论文.docx
- 基于Workbench的捞钢机起升机构性能分析及优化设计-工程力学专业论文.docx
- 基于Workflow和EAI技术的BPM系统的研究与实现-管理科学与工程专业论文.docx
- 基于workflow和rest的港口电子商务架构设计-信息管理专业论文.docx
- 基于Worklight的企业级移动应用架构设计及实现-电子与通信工程专业论文.docx
- 基于WorldFIP现场总线协议的智能电-气阀门定位器的开发-控制理论与控制工程专业论文.docx
最近下载
- 职称技术工作报告范文.docx VIP
- (2021年品管圈活动成果报告书)降低ICU患者身体约束率.docx VIP
- 解读学习2025《党政机关厉行节约反对浪费条例》培训课件.pptx VIP
- 《咏物诗》-公开课件.ppt VIP
- 品管圈QCC降低ICU患者约束缺陷率.pptx VIP
- 《党政机关厉行节约反对浪费条例》(2025)附新旧对照解读课件.pptx VIP
- 安徽单招考试2025、2025分类考试真题语文数学英语试题(含答案).pdf VIP
- 保证农民工工资及时支付的措施.docx VIP
- 2024届高考语文复习:诗歌鉴赏之题材 咏物言志诗 课件(共33张PPT).pptx VIP
- 手外伤急诊手术护理配合.pptx VIP
文档评论(0)