- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于汉语网络新闻评论的情感语料库标注研究
第15卷第6期
第15卷第6期 北京邮电大学学报(社会科学版) V01.15,No.6
2013年12月 Journal of Beijing University of Posts and Telecommunications(Social Sciences Edition)Dec.2013
基于汉语网络新闻评论的情感语料库标注研究
崔晓玲
(北京邮电大学人文学院,北京100876)
摘要:为揭示汉语网络新闻评论文档在情感表达上的特性,基于评价理论的态度系统,采用语义标注方法,试图从多 角度揭示汉语情感语义表达的参数特征。研究发现汉语情感语义的表达呈现多参数性特征。该情感语料库不仅可为目前 汉语情感计算提供结构性情感语义资源、方便机器学习、利于观点抽取和整合工作,还将会为现有计算机和语言学领域 的汉语情感标注提供一种多参数的操作方法。
关键词:情感语料库;汉语;情感参数;评价理论;网络新闻
中图分类号:G210.7;H13 文献标识码:A 文章编号:1008-7729(2013)06—0021—09
一、引 言
情感研究一直是社会学、心理学、哲学界共同关注的焦点问题。他们主要关注口语、书面语和肢 体语言中所蕴含的情感表达,探讨情感与社会、情感与心智、情感与认知之间的关系。但是随着互联 网的迅猛发展,用于表达情感的平台比以往更加多元化,特别是网络博客和网络论坛为代表的网络平 台的迅速兴起,为情感和观点等主观性信息的传播与检索提供了诸多便利。随着带有情感色彩的主观 性文本的不断激增,情感分析也成为当今计算机学科新兴的研究课题之一。
二、关于情感语料库的相关研究
情感语料库是情感分析的重要前提和基础。目前情感语料库研究多以英语情感语料库为主,且多 致力于观点持有者和被评价对象的抽取。国外的情感语料库主要有PangLee影评语料库11 J、Berar. dinelli电影评论语料库旧J、HuLiu的产品评论语料库∞。、Wiebe的新闻评论语料库(MPQA)(multiple. perspective QA)t4]、TREC2006—2009博客数据库∞J、NTCIR 2006新闻报道评测系统‘61和Junko Minato的
日本情感口语语料库一o。迄今为止,情感语料库的建设和标注呈现多体裁、多层面、多理论和多方法
性等特征。
基于情感语料库的情感研究也随之兴起。早期的情感研究,如Turney et a1.(2002)伸o;Pang et a1. (2002) 等主要致力于情感分类。目前大部分情感分析主要依赖于词袋法和语义极性方法划分情感文 档p1。然而,这些方法都忽视了以下重要内容:①情感分类需要以完善的态度类别和其他语义属性对 态度表达式进行更细致的语义分析;②这种表达式的原子结构不是由单个词汇,而是由连贯的词组构 成的评价组块¨ 。近年来细粒度情感分析受到越来越多的关注,主要包括观点持有者(Kim and Hovy, 2004,2005,2006。11-13j;Choi et a1.,2005。14。)和观点对象的抽取(Kim and Hovy,2006。1引;Ruppen— hofer et a1.,2008‘15|;Hu and Liu,2004旧o)。但是目前,情感分析的最大挑战在于精确识别包括评价
收稿日期:2013—08.28 基金项目:北京邮电大学青年科研创新计划专项课题(2012G470642)
作者简介:崔晓玲(1972一),女,朝鲜族,黑龙江伊春人,北京邮电大学人文学院副教授,硕士生导师,主要研究方向 为功能语言学、计算机语言学、对比语言学等。
·2l·
万方数据
北京邮电大学学报(社会科学版)
北京邮电大学学报(社会科学版) 2013年第6期
者和被评价者、情感类别、情感极性在内的完整的情感表达式。随着系统功能语言学评价理论被移植 到计算机情感研究领域,基于评价理论的情感研究也渐渐兴起。国外最早基于评价理论进行计算机情感 分析的是Taboada和Grieve(2004)。1 ,随后出现了Whitelaw(2005)[9 3,Bloom,Grag和Argamon (2007)016],Read、Hope和Carroll(2007)‘17 J,Bloom(2011)¨副等。评价理论可以大大改进以传统词汇
技术为基础的分析结果H一。 国内汉语情感语料库建设方面主要有:清华大学标注的有关旅游景点描述的情感语料库Yang et a1.
(2006)¨9I;大连理工大学徐琳宏、林鸿飞、赵晶等建立的记叙文体情感语料库。20I;厦门大学苏劲松建 立的全宋词语料库怛1I;哈尔滨工业大学赵妍妍、秦兵、车万翔、刘挺等在数码相机领域构造的含有20 000个情感句的无人工标注大规模语料库悼2I;中
您可能关注的文档
最近下载
- 初中音乐公开课《爱我中华》优秀教学设计与反思.docx
- J-STD-002C引脚,端子,焊片和接线柱可焊性测试英文版.pdf VIP
- 燃气公司生产安全标准化手册资料.pdf VIP
- 《海底世界》作业设计.docx VIP
- 2024年湖南华容县事业单位招聘专业技术人员历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 安全生产标准化资料安全投入.doc VIP
- 广东省韶关市2022-2023学年高一下学期期末数学试题含答案.pdf VIP
- 打印设备维护服务投标方案.docx
- T_CAMDI 050.1-2020 内窥镜配套使用器械 第1部分 通用要求.pdf
- 《我来了两个多月了》教学设计.pptx VIP
文档评论(0)