2010年度媒体新词语调查.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年度媒体新词语调查

2010年度媒体新词语调查 为及时了解和把握词语创新和使用的实际情况,记录 2010 年中国社会的变化,国家语 言资源监测与研究中心在前四年开展年度新词语专项调查的基础上,又对 2010 年度的新词 语进行了调查统计。同时跟踪调查了2007 、2008 、2009 年度新词语在 2010 年度的使用情况。 一 调查对象 这里的年度新词语,指的是当年新产生并在大众媒体中出现的词语(或词义)。本次调 查的对象是 2010 年度产生的新词语,包括新产生的词语和已有词形又出现新义的,也包括 2009 年 12 月中旬以后产生而在 2009 年度新词语调查中没能及时收录的个别词语。 二 调查语料 调查语料源自国家语言资源监测语料库中平面媒体、有声媒体和网络媒体(新闻), 在用字用语调查所用语料的基础上,增加了《新京报》2010 年全年语料。共计 1 301 850 个文本文件,1 116 623 140 字次。 本次调查的新词语,限于在主流媒体(报纸、广播电视及网络新闻)中出现的,只出 现在人们口头或网络BBS 、博客、微博中的没有包括在内。 另外,还利用百度、谷歌等搜索工具,查对了每一个词语最初出现的时间,以核查、 确认其新词语的身份。 三 调查方法 本次调查仍采用“机器+人工”的方法,即先利用计算机对调查语料进行新词语候选集 的自动提取,再在此基础上进行人工排查和确认。在机器自动提取候选集时,采用了“全切 ① 分对比法”“切分组合对比法”和“特征对比法”三种方法,目的是取长补短,使新词语的 搜获更为全面,减少遗漏。 新词语确认的原则与 2007 年、2008 年和 2009 年保持一致② 。在 3 月 1 日至4 月 15 日 将提取出的新词语放在中国语言文字网、中文互动百科网、有声媒体语言资源网等网站上公 示,广泛征求意见,网友们对某些词目及释义提出了宝贵意见,也做了一些补充。词表据此 ①国家语言资源监测与研究中心《中国语言生活状况报告(2007 )》下编第 348 页,商务印书馆。2008 年。 国家语言资源监测与研究中心《中国语言生活状况报告(2008 )》下编第 321 页,商务印书馆。2009 年。 国家语言资源监测与研究中心《中国语言生活状况报告(2009 )》下编第 323 页,商务印书馆。2010 年。 ②国家语言资源监测与研究中心《中国语言生活状况报告(2007 )》下编,北京:商务印书馆。2008 年 11 月,349-351 页。国家语言资源监测与研究中心《中国语言生活状况报告(2008 )》下编,北京:商务印书 馆。2009 年 9 月,321 页。 1 ① 做了调整与修改 。所以,这份新词语表也凝结着网友们的智慧和心血。 四 调查结果 经过层层筛选和专家审定,从 2010 年语料中共提取出新词语 500 条,见本书所附光盘 《2010 新词语表》。下面是对这500 条新词语进行统计分析的结果。 1.词语长度 词语长度是词汇的一个重要特征。计算时一个汉字、一个字母或一个阿拉伯数字,都算 一个字长。统计结果显示,数量排前的依次为三字词、四字词、二字词。三字词语占 53.00%, 是全部年度新词语的一半多;而且几年来一直走高,比 2009年高出 1.99 个百分点,比 2008 年高出 5.37 个百分点;四字词语占 22.60%,比 2008 年低 5.25 个百分点,比 2009 年高出 5.18 个百分点;二字词语占 17.00%,比 2008 年高出 1.68 个百分点,但比 2009 年回落了 1.69 个百分点。三字词语比例持续增高,与近几年多用热门格式造词有关。2010 年除了持 续 2009 年的“被××、楼××”、“××门、××族”外,“××哥、××姐、××帝、 ××体”以及由“微博”衍生

文档评论(0)

ldj215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档