基于微博情感分析的分词方法的研究--毕业论文汇.docVIP

  • 30
  • 0
  • 约3.83万字
  • 约 41页
  • 2018-06-09 发布于浙江
  • 举报

基于微博情感分析的分词方法的研究--毕业论文汇.doc

基于微博情感分析的分词方法的研究--毕业论文汇

本科学生毕业设计 基于微博情感分析的分词方法的研究摘要 数十年来,我们从几台电脑发展到家家户户存在多台电脑,从没有渠道了解实事到评论各种社会新闻、明星八卦、微博、状态、说说、朋友圈等主客观文本信息。微博,我个人认为是迷你日志,也就是公共可观赏的概括日记。是一类关于交友任意时间任意地点发送迷你生活状态的动态网页。微博共享和交流的信息,其更在意的是时刻和自变量。这里的情感分析也叫做态度的提取,都指的是将训练数据中的情感、意见、爱恨提取出来。主观的训练数据 (也就是语义态度) 在中国其研究情绪十分高涨,倾向于探究文本中包涵的情感是主观还是客观,褒义还是贬义的特点。 本文认为,微博的情感倾向性与所用的分词方法、褒贬义的强度、主客观的强度等因素有关。所以本文提出了一个以几种分词方法为主要的微博情感分析研究,选择bi-gram、斯坦福、中科院、哈工大作为微博的特征,以逻辑回归的模型作为此系统的机器学习机制,利用标注为主、客观的微博训练数据获得基于逻辑回归模型的主客观分析模型。这系统执行后,得出结论:总体来说,斯坦福中文分词,中科院中文分词,哈工大中文分词都是非常值得我们提倡的分词工具,但由于微博语言是一种非严肃的迷你日志,存在误导如表情符号、错别字等,这三种分词工具在微博语料上的分词效果并不理想,而n-gram分词在形势上对微博语料的分词更有效。 由于评测时间比较仓促,在评测过程中也

文档评论(0)

1亿VIP精品文档

相关文档