基于动态流通语料库的现代汉语词语研究.pptVIP

基于动态流通语料库的现代汉语词语研究.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于动态流通语料库的 现代汉语词语研究 北京语言大学 应用语言学研究所 张 普 Zhangpu@blcu.edu.cn Tel:008610Fax:008610主要内容 动态语料库 流通度 词语研究 动态语料库 与共时语料库相对而言,是历时语料库,是对语言的变化进行检测和监测的语料库。 特点:语料是动态的     语料是历时的     语料是与时俱进、不断更新的 语言知识滞后 无法反映大规模真实文本词语 克隆、宽带、超平、背投、非典、疑似、喷塑、科盲、沙尘暴、数字化、VCD、WTO、CEO、因特网、网民、网虫、上网、下载、消毒软件、泡沫经济、环保工程、高新技术、知识创新、纳米技术、现代远程教育、高致病性禽流感、H5N1、扑杀、叮当村、群死群伤、公投、勇气号、高官、 蒜农、危改、拆迁、房改房、 3加1、3改4、退2进3、市话、高检、扫黄、打假、打黑、反腐倡廉、盗版、大片、管涌、遗洒、千禧、两会、禁放、按揭、套牢 三讲、三个代表、豆腐渣工程、邓小平理论、阿富汗、北方联盟、本拉登、科索沃、法轮功、申奥、奥组委 APEC、克林顿、布什、反恐、世界杯、黑哨 菲佣、足按、三陪小姐、美体修形、鸿运当头、唐装、脐装、太阳裙、透明装、人体彩绘、人体艺术、酷毖、很in、美白、净白、柔嫩、双赢、人气、另类 年龄的“代沟” 生理年龄的“代”在延长 社会年龄的“代”相对稳定 语言年龄的“代”在缩短 改变语言的时间观 共时时间观 历时时间观 相对时间观 ——共时中有历时和历时中有共时 共时语料库的历时观察 香港城市大学“共时语料库”95-05 观察: 大哥大--手提--手持--移动电话--手机 互联网--因特网 关于“非典”的例子 2003年2月28日,46岁的世界卫生组织(WHO)传染病专家乌尔巴尼博士在河内一个华裔美国商人约翰尼·陈身上发现了一种非常规病毒,引起这种疾病的病毒与以往导致感冒、肺炎等疾病的病毒完全不同,他称之为“非典型肺炎病毒”,并随即向世界卫生组织报告,世界卫生组织建议称这种疾病为“严重急性呼吸系统综合症”。 18天后,乌尔巴尼死于自已一个月前发现的疾病——“严重急性呼吸系统综合症”。 关于“非典”的例子 2002年11月:非典型肺炎第一个病例,佛山市。 2003年1月:第一次报告病例, SARS是一个新的病毒,河源市。 2003年1月后,发现SARS病情在中山、佛山、广州市出现了,我们把它命名为非典型传染性肺炎。 2003年2月11号,我们向世界卫生组织驻北京代表处报告了这个情况,世界卫生组织在2月14号发行的流行病记录周刊当中,把它称为SARS。 世界卫生组织(WHO)在3月15日新公布的名称已正式定为“严重急性呼吸道综合征”(Severe Acute Respiratory Syndrome),简称SARS。 3月21号,世界卫生组织开始使用SARS来称呼这个新的疾病。 3月18日,德国和中国香港中文大学的实验室用电子显微镜拍到了一种病毒。5分钟之内,该病毒的照片就通过网站发布出来,以供其他实验室的科学家参考。 3月21日晚上,香港大学的裴伟士向“全球病毒实验室”各成员发了一个电子邮件,宣称从患者组织中分离了一种病毒,经电子显微镜下形态观察表现为冠状病毒。很快这项实验在美国、加拿大等其他成员实验室中重复出来。 3月26日开始,中国参与了世界卫生组织全球协作网路。并且发现SARS的疾病病因可能是冠状病毒。 关于“非典”的例子 有“非典”字样的网页:39458个 新浪有“SARS”的网页:12410个 有“萨斯”字样的网页:1660个         俞允海《非典还是SARS 》 关于“非典”的例子 2003年入选动态流通语料库的14家主流报纸是(按音序排列): 北京青年报 北京日报 北京晚报  法制日报  光明日报 环球时报  今晚报  南方周末 人民日报  深圳特区报 新民晚报 羊城晚报  扬子晚报  中国青年报 关于“非典”的例子 14种报纸 2003年1月1日-12月25日 总文件数:562669个。即56万2千多个文本。? ? 总字数:426805177字。即约4亿3千万字。 动态追踪发展历程 描述“非典”动态流通曲线的例子 衡量动态语料库的四个标准 是否是动态滚动语料 语料库加工是否是动态的加工方法 是否取得动态的加工结果(走势图) 语料库的文本是否具有量化的流通度属性 报告内容 动态语料库 流通度 词语研究 从频度到流通度 使用度: 提纲 13次  3类8篇      哨棒 13次  1类1篇 通用度:   

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档