基于微博情感分析的分词方法的研究本科论文.docVIP

基于微博情感分析的分词方法的研究本科论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于微博情感分析的分词方法的研究本科论文

本科学生毕业设计 基于微博情感分析的分词方法的研究摘要 数十年来,我们从几台电脑发展到家家户户存在多台电脑,从没有渠道了解实事到评论各种社会新闻、明星八卦、微博、状态、说说、朋友圈等主客观文本信息。微博,我个人认为是迷你日志,也就是公共可观赏的概括日记。是一类关于交友任意时间任意地点发送迷你生活状态的动态网页。微博共享和交流的信息,其更在意的是时刻和自变量。这里的情感分析也叫做态度的提取,都指的是将训练数据中的情感、意见、爱恨提取出来。主观的训练数据 (也就是语义态度) 在中国其研究情绪十分高涨,倾向于探究文本中包涵的情感是主观还是客观,褒义还是贬义的特点。 本文认为,微博的情感倾向性与所用的分词方法、褒贬义的强度、主客观的强度等因素有关。所以本文提出了一个以几种分词方法为主要的微博情感分析研究,选择bi-gram、斯坦福、中科院、哈工大作为微博的特征,以逻辑回归的模型作为此系统的机器学习机制,利用标注为主、客观的微博训练数据获得基于逻辑回归模型的主客观分析模型。这系统执行后,得出结论:总体来说,斯坦福中文分词,中科院中文分词,哈工大中文分词都是非常值得我们提倡的分词工具,但由于微博语言是一种非严肃的迷你日志,存在误导如表情符号、错别字等,这三种分词工具在微博语料上的分词效果并不理想,而n-gram分词在形势上对微博语料的分词更有效。 由于评测时间比较仓促,在评测过程中也出现了一些错误,经过和参加单位的不断讨论,也进行了及时的修正;同时,对于评测方法的制定、评测指标的选择、人工标注的质量等都存在值得商榷的地方,需要进一步分析和完善。 关键词:微博;情感分析;中文分词方法; 逻辑回归 ABSTRACT For decades, we have developed from several computers to families exist multiple computers, and channels to understand the practical work to no comments from all kinds of mini log, also is the generalization of the public can see the diary. Is a kind of dating to send any time anywhere mini life state of dynamic web pages.Weibo sharing and communication of information, it is more concerned moment and the independent variables.The extraction of sentiment analysis also called attitude here, is refers to the training data are extracted from the feelings, opinions, love and hate.he subjective training data (that is, the semantic attitude) sentiment is running high in China, its research, tend to explore the inclusion in the text of the emotional it is subjective or objective, the characteristics of good or derogatory. Think, weibo emotion tendentiousness and the strength of the segmentation method, used by praise or blame righteousness, such as the strength of the subjective and objective factors.So this paper puts forward a word segmentation methods as the main weibo emotional analysis, choose the bi - gramm, Stanford, the Chinese academy of sciences, Harbin institute of technology as a feature of weibo in a logistic regression model as a machine learning mechanism

您可能关注的文档

文档评论(0)

店小二 + 关注
实名认证
文档贡献者

包含各种材料

1亿VIP精品文档

相关文档