基于汉语网络新闻评论的情感语料库标注研究.docx

基于汉语网络新闻评论的情感语料库标注研究.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于汉语网络新闻评论的情感语料库标注研究

第15卷第6期 第15卷第6期 北京邮电大学学报(社会科学版) V01.15,No.6 2013年12月 Journal of Beijing University of Posts and Telecommunications(Social Sciences Edition)Dec.2013 基于汉语网络新闻评论的情感语料库标注研究 崔晓玲 (北京邮电大学人文学院,北京100876) 摘要:为揭示汉语网络新闻评论文档在情感表达上的特性,基于评价理论的态度系统,采用语义标注方法,试图从多 角度揭示汉语情感语义表达的参数特征。研究发现汉语情感语义的表达呈现多参数性特征。该情感语料库不仅可为目前 汉语情感计算提供结构性情感语义资源、方便机器学习、利于观点抽取和整合工作,还将会为现有计算机和语言学领域 的汉语情感标注提供一种多参数的操作方法。 关键词:情感语料库;汉语;情感参数;评价理论;网络新闻 中图分类号:G210.7;H13 文献标识码:A 文章编号:1008-7729(2013)06—0021—09 一、引 言 情感研究一直是社会学、心理学、哲学界共同关注的焦点问题。他们主要关注口语、书面语和肢 体语言中所蕴含的情感表达,探讨情感与社会、情感与心智、情感与认知之间的关系。但是随着互联 网的迅猛发展,用于表达情感的平台比以往更加多元化,特别是网络博客和网络论坛为代表的网络平 台的迅速兴起,为情感和观点等主观性信息的传播与检索提供了诸多便利。随着带有情感色彩的主观 性文本的不断激增,情感分析也成为当今计算机学科新兴的研究课题之一。 二、关于情感语料库的相关研究 情感语料库是情感分析的重要前提和基础。目前情感语料库研究多以英语情感语料库为主,且多 致力于观点持有者和被评价对象的抽取。国外的情感语料库主要有PangLee影评语料库11 J、Berar. dinelli电影评论语料库旧J、HuLiu的产品评论语料库∞。、Wiebe的新闻评论语料库(MPQA)(multiple. perspective QA)t4]、TREC2006—2009博客数据库∞J、NTCIR 2006新闻报道评测系统‘61和Junko Minato的 日本情感口语语料库一o。迄今为止,情感语料库的建设和标注呈现多体裁、多层面、多理论和多方法 性等特征。 基于情感语料库的情感研究也随之兴起。早期的情感研究,如Turney et a1.(2002)伸o;Pang et a1. (2002) 等主要致力于情感分类。目前大部分情感分析主要依赖于词袋法和语义极性方法划分情感文 档p1。然而,这些方法都忽视了以下重要内容:①情感分类需要以完善的态度类别和其他语义属性对 态度表达式进行更细致的语义分析;②这种表达式的原子结构不是由单个词汇,而是由连贯的词组构 成的评价组块¨ 。近年来细粒度情感分析受到越来越多的关注,主要包括观点持有者(Kim and Hovy, 2004,2005,2006。11-13j;Choi et a1.,2005。14。)和观点对象的抽取(Kim and Hovy,2006。1引;Ruppen— hofer et a1.,2008‘15|;Hu and Liu,2004旧o)。但是目前,情感分析的最大挑战在于精确识别包括评价 收稿日期:2013—08.28 基金项目:北京邮电大学青年科研创新计划专项课题(2012G470642) 作者简介:崔晓玲(1972一),女,朝鲜族,黑龙江伊春人,北京邮电大学人文学院副教授,硕士生导师,主要研究方向 为功能语言学、计算机语言学、对比语言学等。 ·2l· 万方数据 北京邮电大学学报(社会科学版) 北京邮电大学学报(社会科学版) 2013年第6期 者和被评价者、情感类别、情感极性在内的完整的情感表达式。随着系统功能语言学评价理论被移植 到计算机情感研究领域,基于评价理论的情感研究也渐渐兴起。国外最早基于评价理论进行计算机情感 分析的是Taboada和Grieve(2004)。1 ,随后出现了Whitelaw(2005)[9 3,Bloom,Grag和Argamon (2007)016],Read、Hope和Carroll(2007)‘17 J,Bloom(2011)¨副等。评价理论可以大大改进以传统词汇 技术为基础的分析结果H一。 国内汉语情感语料库建设方面主要有:清华大学标注的有关旅游景点描述的情感语料库Yang et a1. (2006)¨9I;大连理工大学徐琳宏、林鸿飞、赵晶等建立的记叙文体情感语料库。20I;厦门大学苏劲松建 立的全宋词语料库怛1I;哈尔滨工业大学赵妍妍、秦兵、车万翔、刘挺等在数码相机领域构造的含有20 000个情感句的无人工标注大规模语料库悼2I;中

文档评论(0)

133****9031 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档