中文微博情感评测报告培训课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文微博情感评测报告 浙江工商大学 计算机与信息工程学院 报告人:陈威 指导老师:施寒潇 精品文档 提纲 研究背景及意义 任务预备 任务分析与实施 总结 精品文档 背景 在Web2.0大背景下,微博作为用户发言、相互交流的重要途径,具有数量大、更新快的特点,是从中发掘用户观点以及情感倾向的可靠来源。针对微博的自然语言处理研究已成为当前一个新的研究热点和前沿课题,而情感分析就是其中一个热点话题。 精品文档 微博情感分析 情感分析,包括观点挖掘、观点分析、主客观分析等。情感分析的目的是从文本中挖掘用户表达的观点以及情感倾向。 主要技术:(1)情感词典与规则相结合的方法(2)机器学习 精品文档 意义 过滤不合法网络舆论信息,营造良好的网络环境 监督舆论的走势,辅助社会管理 实现商品个性化推荐 对社会计算的研究有重要的意义 精品文档 提纲 研究背景及意义 任务预备 任务分析与实施 总结 精品文档 任务清单 任务一:观点句判定 任务二:分析情感倾向 任务三:提取情感要素 精品文档 技术准备 分类器:SVM 、 CRF 情感词典扩充:加入网络用语和表情符号 中文分词技术:海量云分词 精品文档 提纲 研究背景及意义 任务预备 任务分析与实施 总结 精品文档 任务处理流程 构建特征集 人工标注 训练语料 训练集及训 练模型生成 预测集生 成及预测 精品文档 人工标注 利用本团队自主开发的标注工具标注 严格按照主办方提供的标注规则,从样列文件中选取1219条具有代表性的微博进行标注 标注内容包括:是否为观点句、情感倾向性、情感要素 精品文档 训练语料 任务一:人工标注的1219条微博 任务二:任务一训练语料中451条为观点句的微博 精品文档 任务一特征集 特征序号 特征类型 特征内容 描述 1 链接 是否含有url链接 链接通常以http:开头。 2 表情符号 是否含有情感表情符号 参考网络表情符号词典 3 情感词 是否出现情感词 在基本的情感词典基础上,再加入包含情感的网络用语作为情感词典的扩充。 4 情感词个数 情感词出现的个数 5 标点符号 是否出现感叹号和问号。 ! ? 6 标点符号 是否出现连续的感叹号和问号。 !!!,??? 7 反转词 是否出现反转词。 是否情感词前面存在反转词(情感词前3个词之内) 8 程度副词 是否含有程度副词。 很,特别等 9 语气词 是否含有语气词。 啊,哪,啦,呀,吧,呢 10 网络用语 是否存在网络用语 参考网络用语词典内容 11 目标值 是否为观点句 精品文档 任务二特征集 特征序号 特征类型 特征内容 描述 1 链接 是否含有url链接 链接通常以http:开头。 2 正面表情符号 正向情感表情符号个数 参考网络用语表情词典 3 负面表情符号 负向情感表情符号个数 参考网络用语表情词典 4 正面情感词 正向情感词出现个数 在基本的情感词典基础上,加入包含情感的网络用语作为情感词典的扩充。 5 负面情感词 负向情感词出现个数 在基本的情感词典基础上,加入包含情感的网络用语作为情感词典的扩充。 6 反转词 是否出现反转词。 是否情感词前面存在反转词(情感词前3个词之内) 7 问号 是否出现问号 8 标点符号 是否出现问号或者连续的问号。 9 目标值 情感正负 精品文档 训练模型生成 网络用语、表情特征提取 提取特征 训练模型 格式转换 分词 SVM训练 人工标注语料 海量分词格式 分词结果 训练集 格式转换 精品文档 预测集生成 网络用语、表情特征提取 提取特征 格式转换 分词 待预测微博 海量分词格式 分词结果 预测集 格式转换 预处理 精品文档 预测集生成及预测细节 任务一分词前预处理 : 过滤类似 “我感到很高兴”这样的主观抒发情感句,并定为非观点句。 任务二预测集生成:根据任务一的预测结果,从中提取预测为观点句的微博 使用SVM对预测集进行预测 精品文档 评测结果 任务 微平均 宏平均 正确率 召回率 F值 正确率 召回率 F值 一 0.645 0.959 0.772 0.649 0.960 0.770 二 0.804 0.771 0.787 0.809 0.778 0.793 精品文档

文档评论(0)

liuxiaoyu98 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档