流行语动态跟踪的研究综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
流行语动态跟踪研究综述 谢学敏‘吴志山2史艳岚3 (北京语言大学应用语言学研究所,北京,100083) E‘mail:.x..ie..x..u..e,.m...i.n...@...b..1.c..u....e..d..u...~cn.w..z..s..商....b..1.c.。u.。..e..d—.u....—c—n 摘要:流行语研究在当今社会中起着非常重要的作用,尤其是对于汉语词汇学、社会语言学 等学科的研究有着一定的促进作用。在文中我们简要的介绍了从大规模动态流通语料库中提 取流行语的方法,包括语料库结构和技术路线,同时还介绍了和流行语相关的研究项目。 关键词:流行语; 动态: 研究: 0引言 流行语跟踪研究是国家语言文字工作委员会“十五”重大课题,承担工作的是北京语言 大学应用语言学研究所。这项研究借助大规模动态流通语料库以及计算机技术手段和必要的 分析,考察流行语在时间和空间上的分布状况,动态跟踪流行语的产生及传播过程,使流行 语的发布更具科学性和权威性,并且从此进入定期、持续、滚动发布的正常轨道。这一探究 对于汉语报刊词汇、新词语及汉语词汇学的进一步研究也有重要的意义。我们的研究工作在 国家语委、北京语言大学,及其他相关单位的领导和支持下,到目前为止,已经进行了三次 流行语发布: 第一次发布是2003年1月由jE京语言大学、中国新闻技术工作者联合会、中国中文信 息学会三家机构主办,华夏大地教育网、千龙新闻网协办,获得福建双笔码软件开发有限公 司独家赞助。这次发布会邀请了十五家主流报纸以及在京其它新闻单位的记者参加,同时还 邀请了许多知名的语言学专家和中文信息处理专家出席。 第二次发布是2003年7月,这次发布由于受“非典”的影响,没有开新闻发布会,而 是采取独家授权的方式由中国青年报发布。 第三次发布是2004年1月,由北京语言大学、中国新闻技术工作者联合会、中国中文 信息学会三家机构联合召开了新闻发布会。发布当天,中央电视台国际频道《中国新闻》节 目就进行了报道。与此同时,由北京语言大学应用语言学研究所DCC博士研究室和中国中 央电视台国际频道联合制作的10期对外汉语教学节目《欢乐中国》也开始播出,其中的新 词语提取以及脚本写作均由DCC博士研究室完成。该节目播出后,社会反响良好。 流行语的发布特色 加大时间密度:我们由最初的一年一次发布变成一年两次发布。 加大领域密度:由最初的十大流行语发布,分为非典专题、经济类专题、国际专题、综合类 等四类来发布。 提高发布规格:和中央电视台国际频道合作,共同发布。 入选的十五家报纸是(按音序排列) 北京日报 北京晚报 北京青年报 光明日报 法制日报 环球时报 经济日报 今晚报 南方周末 人民日报 深圳特区报 新民晚报 羊城晚报 扬子晚报 中国青年报 语料总量 日期:每年1月1日一12月25日 2002年总文件数:602534个。即60万2千多个文本。 总字数:545784375。即约:5亿多万字。 2003年总文件数:562669个。即56万2千多个文本。 总字数:426805177字。即约4亿3千万字。 1、提取流程 1.1建厍流行语的研究是基于动态流通语料库进行的,因此,我们非常重视语料库的建 设。 我们的库结构分为:网页库、文本库、提取数据库。考虑到语料量巨大。我们采用了大 型关系数据库建立数据库,最后通过编写数据库脚本来提取流行语。因为流行语发布的工程 量巨大,因此我们在建立语料库的时候采取的是比较合理的结构,以便发挥计算机的最大使 用效率。我们采用的是服务器级的数据库管理系统,集客户机朋&务器、多层结构于一身。 流行语研究的历史由来已久,世界上的许多国家很早就对流行语进行过研究,改革开放 以来,人民在思想意识形态各个方面都发生巨大变化,网络传播作为一种全新的现代化传播 方式,有着与传统媒介截然不同的新特征。这也就是我们建设网络分布式动态流通语料库的 初衷。我们建立的语料库是一个动态更新的语料库,这个语料库的相关内容应该可以随着时 间的推移而更改。 我们采用Visual

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档