网站大量收购独家精品文档,联系QQ:2885784924

现代汉语词量与分级知识讲解.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代汉语词量与分级 思考 一、现代汉语的词量有多大? 二、包括哪些词语? 三、分几“级”合适?每级界限在哪? 四、词级划分依据的标准和方法? 当代最具影响力的两个常用词表: 《现代汉语频率词典》,8548条 《对外汉语教学词汇大纲》,8822条 “语法、语音是有系统的,词汇是一盘散沙。” 最初实践,对《现代汉语词典》的计量研究 一、现代汉语的词汇量有多大? 对词典的考察 对词表的考察 对大规模真实语料的考察 从词典来考察“词汇量” 1.《现代汉语词典》的词汇 规范型词典全面反映语言的词汇体系,就要对词语作全面收录,不因某些词语无需查检而不收。 规范型词典对民族共同语词汇的记录是全面的,但不是穷尽的(在理论上和实践上都是不可能的)。《现汉》是一部中型词典,它在收词上既是全面的,又有较强的选择性。选词的依据,主要不是看查考的需要,而是看词语在语言使用中出现的频率。 晁继周、单耀海、韩敬体:《关于规范型词典的收词问题》,见《〈现代汉语词典〉学术研讨会论文集》,商务印书馆,1996年版,第70、72页。 《现汉》词条61000: -单字条10700(4000) -方言词2600 -科技术语60000*0.2=12000 -书语词3800 =31900 从严计算,32000-40000之间。 在《现汉》的语文词周围存在一条宽阔的接壤词汇带: 1.方言词:《现代汉语方言大词典》共41卷,收41个方言点的词汇,平均每个点收词8000条,其总数达30万条以上。《汉语方言大词典》20万条 2.术语词、行业词:数十个学科、行业,以每个2000计,有数十万条。 3.新词语:近30年间,30000余条,每年约1000条。 4.文言词:《辞源》10万条,《汉语大词典》非现代词。 《当代汉语词典》 中型语文词典 52000 2001 《新华词典》 中型语文词典 50000 2005 《现代汉语规范词典》 中型语文词典 80000 2005 《辞海》 大中型百科词典 120000 1999 《汉语大词典》 大型历时词典 370000 1994 《中文大辞典》 大型历时词典 430000 1962 《汉和大辞典》 大型历时词典 400000 1960 《韩汉大辞典》 大型历时词典 450000 2008 方言词与普通话词语的区分: 拇指 – 大拇指 – 大拇哥 行业词与普通话词语的区分: 招标、投标、竞标、发标、中标、得标 开标、唱标、流标、跑标、串标、围标 接听 主叫、被叫 新词语与普通话词语的区分 裸露、裸照、裸奔、裸泳、裸尸 裸戏、裸晒、裸聊、裸背、裸肩 /裸机、裸眼 / 裸捐、裸退、裸官 书语词与古语词的区分: 古语词 书语词 中性词 口语词 膺选 登第、登科、及第 当选、中选、入选 考取、考中 勖励、勖勉 激发、激励、激扬、嘉勉、砥砺、慰勉 劝勉、勉励、鼓励、劝导 劝说、相劝、开解 劬劳 操劳 奔波、劳累 奔忙 表名 研制者 词语数 时代 现代汉语常用词 频率词典 8548 1986 对外汉语教学词汇大纲 国家汉办 8822 1992 现代汉语词表 刘源 71000 1984 张氏词库 张卫国 109000 1999 知网 董振东 81000 2005 中文词库 张潮生 80000 2005 中文信息处理用词表 孙茂松 120000 2007 现代汉语常用词表 课题组 56008 2008 现代汉语语义分类词典 苏新春 83000 2008 一般的分词软件所带的词库容量:“10-15万” 从词表来考察“词汇量” 从大规模真实语料来考察“词汇量” 来源/规模 词语数 词种数 研制者 时间 通用语料库(4500万) 25万 120000 国家语委 2000 2005年度(9亿) 165万 110000 语言资源中心 2006 2006年度(9.7亿) 260万 107000 语言资源中心 2007 结论: 从对词典的考察来看,属普通话词汇的语文词词量约6万左右。 从对词表和大规模真实语料来看,大概在8-10万左右。 确定词量的关键在普通话词汇与接壤词汇之间如何划界。 二、现代汉语词汇包括哪些词种 那么在6-8万的普通话词汇范围中,包括了哪些词语?试以下面三种为例: 《现代汉语词典》(63000/58000) 《现代汉语语义分类词典》(83000条/77000) 《现代汉语常用词表》(56008/55600) 《现代汉语词典》 63000/58000 45730 38329 《现代汉语语义分类词典》 83000条/77000 50567 《现代汉语常用词表》 56008/55600 交集比较: 《现代汉语词典》 63000/ 58000 45730 38329 31032 现代汉语语义分类词

文档评论(0)

youngyu0301 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档