一种基于句法分析的情感标签抽取方法 - 图书情报工作.pdf

一种基于句法分析的情感标签抽取方法 - 图书情报工作.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于句法分析的情感标签抽取方法 - 图书情报工作

第58卷 第14期 2014年7月 一种基于句法分析的情感标签抽取方法 ■ 李纲 刘广兴 毛进 叶光辉 [摘 要]指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意 见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极 性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回 率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的 抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。 [关键词]情感标签 观点挖掘 依存句法分析 产品评论 [分类号]TP391.3   DOI:10.13266/j.issn.0252-3116.2014.14.002 1 引 言 点词关系的抽取。观点词的抽取有两种方式:一种 是基于词性的直接抽取,包括词组模式[3]、情感词典   随着电子商务的快速发展,商品或服务的交易越 [4-5] 构建 等方法;另一种是基于观点词评论对象识别 来越多地在互联网上发生。根据2014年1月中国互 [2] 的间接抽取,包括基于共现规则的抽取方法 、基于 联网信息中心(CNNIC)发布的第33次《中国互联网 [6] 句法分析的抽取模型 。两种抽取方式存在着一定 络发展状况统计报告》,截至2013年12月,我国网民 的性能差异,主要表现为:直接抽取不容易遗漏情感 网络应用中网络购物用户规模达3.02亿,使用率达 词汇,准确性也比较高,但是不容易得到观点词的评 到48.9%。随着网络购物的不断发展和用户量的增 论对象及相互之间的关系;间接抽取可以一步完成 多,利用Web2.0的强交互性,顾客在互联网交易平 “评论对象 -观点词”意见对的抽取,但是在评价对 台上发表产品或服务评论的行为越来越频繁,线上 象隐含的情况下容易遗漏观点词,而且由于评论对 产品或服务的评论信息量急剧增加。这些评论包含 象种类的不确定性,评论对象词库构建起来比情感 顾客对产品的功能、性能等方面的观点,具有巨大的 词典复杂很多。观点词情感极性的研究则集中关注 价值。线上商家和顾客可以通过分析评论获取有用 如何通过规则或方法的设计来量化情感倾向及其程 [2] 的信息以辅助决策 ,但是由于评论信息存在数量 度,目前主要有3种方法:基于词典的语义距离计算 大、内容繁杂、非结构化等特点,对评论信息的分析 方法[7-8]、基于语料库的语义关联方法[9-10]和基于机 需要运用自然语言处理技术中观点挖掘的相关理论 器学习的文本情感分类方法[11-12]。 及技术,抽取出关于产品的评价观点。   目前在观点挖掘的研究中,对篇章和语句整体情   观点挖掘的研究主要分为两个方面: 观点词 ① 感极性的计算方面已经取得了比较好的效果。然而, 或观点句抽取方法及技术; 观点词或观点句情感 ② 对语句中各语义成分及其对应关系的识别方面,还没 极性计算。观点词的抽取与情感极性的判定是观点 有形成十分有效的解决方案。具体的问题在于:情感 句抽取与情感极性计算的基础,在此本文重点关注。 词和评价对象的识别精度和鲁棒性不高;情感的上下

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档