- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于动态流通语料库的流行语释义信息自动提取研究.pdf
基于动态流通语料库的流行语释义信息自动提取研究·
谢学敏1彭锦维2张普3
(1,3北京语言大学应用语言学研究所,2,北京语言大学汉语学院北京,100083)
Email:xiexHemin@blcu.edu.cn
摘要:本文对如何从动态流通语科库中提取流行语的释义信息进行了探讨,我们采用关键词表达式
匹配(QueryExpression,.QueryTerms,KeywordExpression)来进行提取,取得了一定的效果。
关键词:动态流通语料库释义关键词表达式提取
Extractthe of
informationbuzzwordsfrom
interpretative
He Circulation
Dynamic Corpus
Xue-min Jin-wei
XIE PENG ZHANGpu
lnstitute of 1
Linguistics,2,School University00083)
(1,3 OfApplied Chinese,BeijingLanguage
Email:xiexHemin@blcu.edu.cn
howto nofwordsand
Abstract:This introduces extractmeinterpretativeinf.0唧atic
paperbriefly
fbmthe Circulation the toe×tractthe
expressionsDynamic Corpus.WemainlyemployKeywordExpression
re]atedinformation.
Circulation xtraet
Keywords.DynamicCorpus;interpretation;Kcywcrd
expression;e
1.研究意义
流行语涉及当代社会的重大事件、焦点问题,以及人们日常生活的各个层面,具有信息
量大、时代性强、传播面广的特点,准确、生动、及时地反映着当代中国的社会面貌与中国
人文化心态的变化。随着流行语的发布,我们的研究工作也在逐渐走向深入。该研究课题属
于国家语言资源监测与研究中心“流行语释义提取研究”子课题。当前的流行语释义提取实
际上还是停留在人工进行标记的阶段,也就是在流行语提取出来以后,由人工添加释义,工
作量大,而且非常不规范,随意性强。如果能够进行自动提取,会在一定程度上减小工作量,
效率也会随之提高。’
该研究课题还有一个重要的意义就是有利于词典的计算机辅助编纂。商务印书馆推出了
新词语词典,但是,他们目前所采用的方式还是由人工从报纸中进行筛选,然后再汇入数据
库进行编纂,工作量很大。所以,如果能够从报纸语料中自动地提取出有用的释义信息,对
于词典的计算机辅助编纂是大有帮助的,同时也可以建立起一个动态的新词语释义获取系
统。
2.国内外已经进行的相关研究工作综述 ’
2.1张津、黄昌宁的研究工作
清华大学计算机系智能技术与系统国家重点实验室的张津、黄昌宁于1996.年提交了国家
自然科学基金重点项目研究报告:《从单语词典中获取定义原语方法的研究及现代汉语定义
原语的获取》,这是汉语学界第一份关于汉语释
原创力文档


文档评论(0)