- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多策略中文微博细粒度情绪分析研究 南华大学 欧阳纯萍 2013年11月18日 南华大学 计算机科学与技术学院 任务概述 技术要点 实验结果 总结 评测任务 微博情绪识别与分类(Close测试): 对于输入的整条微博,本任务要求判断出该微博是否包含情绪。 对包含情绪的微博,要求判别其情绪分类输出为anger 愤怒、disgust 厌恶、fear 恐惧、happiness 高兴、like 喜好、sadness 悲伤、surprise 惊讶中的一种,即单分类输出。 任务概述 技术要点 实验结果 总结 技术要点 技术要点一 朴素贝叶斯分类的特征词选择 ?i=0,判断某词在有情绪微博中的表征作用。 ?i=1,判断某词在无情绪微博中的表征作用。 ?对有无情绪微博中的词性特征进行分析,筛选出表征能力强的词性特征。 最终,经试验取k=4,n=20,得到了796个特征词和19种词性,组成了815个特征集合。 技术要点二 面向细粒度情绪的微博向量化 ?α=0.9,β=0.1, w表示属于第m维情感类的总词数,intension表示情感强度,polarity表示情感极性。 ?对卡方检验的特征词进行情感强度和极性人工标注。(参考大连理工本体库) ?根据计算得到的特征词权重值,对分词后的微博进行向量化。 任务概述 技术要点 实验结果 总结 实验结果 情绪判别实验结果 Precision Recall F-measure NB+SVM 0.6626 0.8012 0.7254 NB+KNN 0.6676 0.7982 0.7271 MAX 0.7494 0.9517 0.7271 情绪分类宏平均实验结果 Macro Precision Macro Recall Macro F-measure NB+SVM 0.2109 0.1996 0.2051 NB+KNN 0.2704 0.3064 0.2873 MAX 0.2844 0.3064 0.2873 实验结果 情绪分类微平均实验结果 Micro Precision Micro Recall Micro F-measure NB+SVM 0.2539 0.3070 0.2779 NB+KNN 0.3133 0.3746 0.3412 MAX 0.3834 0.3976 0.3412 任务概述 技术要点 实验结果 总结 总结 分阶段进行微博情绪分析的方案比较理想。 无论是情绪分类还是情绪判别,特征词的选择,微博的特征化都是非常重要的环节。 本次实验并未对分类算法进行改进,将是下一步工作的重点。 谢 谢! 南华大学 计算机科学与技术学院
文档评论(0)