- 30
- 0
- 约3.83万字
- 约 41页
- 2018-06-09 发布于浙江
- 举报
基于微博情感分析的分词方法的研究--毕业论文汇
本科学生毕业设计
基于微博情感分析的分词方法的研究摘要
数十年来,我们从几台电脑发展到家家户户存在多台电脑,从没有渠道了解实事到评论各种社会新闻、明星八卦、微博、状态、说说、朋友圈等主客观文本信息。微博,我个人认为是迷你日志,也就是公共可观赏的概括日记。是一类关于交友任意时间任意地点发送迷你生活状态的动态网页。微博共享和交流的信息,其更在意的是时刻和自变量。这里的情感分析也叫做态度的提取,都指的是将训练数据中的情感、意见、爱恨提取出来。主观的训练数据 (也就是语义态度) 在中国其研究情绪十分高涨,倾向于探究文本中包涵的情感是主观还是客观,褒义还是贬义的特点。
本文认为,微博的情感倾向性与所用的分词方法、褒贬义的强度、主客观的强度等因素有关。所以本文提出了一个以几种分词方法为主要的微博情感分析研究,选择bi-gram、斯坦福、中科院、哈工大作为微博的特征,以逻辑回归的模型作为此系统的机器学习机制,利用标注为主、客观的微博训练数据获得基于逻辑回归模型的主客观分析模型。这系统执行后,得出结论:总体来说,斯坦福中文分词,中科院中文分词,哈工大中文分词都是非常值得我们提倡的分词工具,但由于微博语言是一种非严肃的迷你日志,存在误导如表情符号、错别字等,这三种分词工具在微博语料上的分词效果并不理想,而n-gram分词在形势上对微博语料的分词更有效。
由于评测时间比较仓促,在评测过程中也
您可能关注的文档
最近下载
- 常用国内外材料的标准及牌号对照教材.pdf VIP
- Focusrite福克斯特control2802 logic使用说明书.pdf
- 基于Simulink的三元锂离子电池的仿真与建模研究.docx
- 上海市徐汇中学2025学年九年级下学期3月月考语文试题.docx VIP
- 线性代数课件.pptx VIP
- 小学数学五年级解方程专项练习题(整数)(每日一练,共21份).pdf VIP
- 物流储配作业管理 2.2.6 规划就地堆码储存区 2.2.5知识点:规划就地堆码储存区.pptx VIP
- 小学数学五年级解方程专项练习题(整数)(每日一练,共29份).docx VIP
- 2024副高(临床医学检验技术)考试真题卷及答案.docx VIP
- 《仓储设备的配置》课件.ppt VIP
原创力文档

文档评论(0)