网站大量收购闲置独家精品文档,联系QQ:2885784924

中文微博情感评测报告.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

中文微博情感评测报告浙江工商大学计算机与信息工程学院报告人:陈威指导老师:施寒潇提纲研究背景及意义任务预备任务分析与实施总结背景在Web2.0大背景下,微博作为用户发言、相互交流的重要途径,具有数量大、更新快的特点,是从中发掘用户观点以及情感倾向的可靠来源。针对微博的自然语言处理研究已成为当前一个新的研究热点和前沿课题,而情感分析就是其中一个热点话题。情感分析,包括观点挖掘、观点分析、主客观分析等。情感分析的目的是从文本中挖掘用户表达的观点以及情感倾向。01主要技术:(1)情感词典与规则相结合的方法(2)机器学习02微博情感分析对社会计算的研究有重要的意义实现商品个性化推荐监督舆论的走势,辅助社会管理过滤不合法网络舆论信息,营造良好的网络环境CBAD意义研究背景及意义01任务预备02任务分析与实施03总结04提纲01任务一:观点句判定03任务三:提取情感要素02任务二:分析情感倾向任务清单分类器:SVM、CRF情感词典扩充:加入网络用语和表情符号中文分词技术:海量云分词技术准备研究背景及意义01任务预备02任务分析与实施03总结04提纲构建特征集01人工标注02训练语料03训练集及训04练模型生成05预测集生06成及预测07任务处理流程严格按照主办方提供的标注规则,从样列文件中选取1219条具有代表性的微博进行标注标注内容包括:是否为观点句、情感倾向性、情感要素利用本团队自主开发的标注工具标注人工标注任务一:人工标注的1219条微博任务二:任务一训练语料中451条为观点句的微博训练语料任务一特征集特征序号特征类型特征内容描述1链接是否含有url链接链接通常以http:开头。2表情符号是否含有情感表情符号参考网络表情符号词典3情感词是否出现情感词在基本的情感词典基础上,再加入包含情感的网络用语作为情感词典的扩充。4情感词个数情感词出现的个数5标点符号是否出现感叹号和问号。!?6标点符号是否出现连续的感叹号和问号。!!!,???7反转词是否出现反转词。是否情感词前面存在反转词(情感词前3个词之内)8程度副词是否含有程度副词。很,特别等9语气词是否含有语气词。啊,哪,啦,呀,吧,呢10网络用语是否存在网络用语参考网络用语词典内容11目标值是否为观点句任务二特征集特征序号特征类型特征内容描述1链接是否含有url链接链接通常以http:开头。2正面表情符号正向情感表情符号个数参考网络用语表情词典3负面表情符号负向情感表情符号个数参考网络用语表情词典4正面情感词正向情感词出现个数在基本的情感词典基础上,加入包含情感的网络用语作为情感词典的扩充。5负面情感词负向情感词出现个数在基本的情感词典基础上,加入包含情感的网络用语作为情感词典的扩充。6反转词是否出现反转词。是否情感词前面存在反转词(情感词前3个词之内)7问号是否出现问号8标点符号是否出现问号或者连续的问号。9目标值情感正负网络用语、表情特征提取01提取特征02训练模型03格式转换04分词05SVM训练06人工标注语料07海量分词格式08分词结果09训练集10格式转换11训练模型生成网络用语、表情特征提取提取特征格式转换分词分词结果待预测微博海量分词格式预测集格式转换预处理预测集生成任务一分词前预处理:过滤类似“我感到很高兴”这样的主观抒发情感句,并定为非观点句。01任务二预测集生成:根据任务一的预测结果,从中提取预测为观点句的微博02使用SVM对预测集进行预测03预测集生成及预测细节评测结果任务微平均宏平均正确率召回率F值正确率召回率F值一0.6450.9590.7720.6490.9600.770二0.8040.7710.7870.8090.7780.793

文档评论(0)

gongmengjiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档