双语辞典学术研讨会(2005-11-26).ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
双语辞典学术研讨会(2005-11-26,广州外语外贸大学 《现代汉语词典》标“〈书〉”词研究 ——兼谈词典对语体义类的标注 厦门大学中文系 苏新春 徐婷 2005-11-26 suxch@ xutingxiamen@ 要点 《现汉》标书词的分布与归类 标书词的词频调查与分析 标书词与四个词语类的区别 改进词语语体色彩标注的设想 一.《现汉》标书词的分布与归类 《现代汉语词典》“凡例”:“一般条目中,标〈书〉的表示书面上的文言词语。”如: 【学子】“〈书〉学生:莘莘(shēnshēn)~(很多学生)。” 【嘉许】“〈书〉夸奖;赞许:品学兼优,深得师长~。” “凡例”显示标“〈书〉”的词具有两个特点: 一是它的使用范围是书面语。 二是它的来源是文言词语。 为了在行文时加以区分,本文用“书语词”表示一般意义的书面用词语,用“标书词”指《现汉》中作了“〈书〉”标示的词。 《现汉》“标书词”共5570条。 “标书词”的内部构成如何?传递着怎样的语言信息?在汉语词汇体系中居于怎样的地位? “标书词”与“古语词”如何区分? 与“旧词语”如何区分? 与“历史词”如何区分? 词典如何实现对不同语体色彩词群的标注? 整词标示部分 1.标示对象为“词” 共有3632条,其中单音节词1090条,多音节词2542条。 多音词2542条包括了出现在单字词目的释义部分中的194条。 【腤】:“〈书〉烹煮(鱼、肉)。” 【哀荣】:“〈书〉指死后的荣誉。” 2.标示对象为“词素” 共528条。 【霭】:“〈书〉云气:烟~、暮~。” 【芸芸】:“〈书〉形容众多:万物~︱~众生。” 3.标示对象为异体字 全部采用“同某”的参见格式。有198例。 【鞌】:“〈书〉同‘鞍’。” 【桮】:“〈书〉同‘杯’。” 4.标示对象兼两类以上者 有311例。 【嬖】:“〈书〉⑴宠爱:~爱丨~昵。⑵受宠爱:~臣丨~妾。⑶受宠爱的人。”按:该例是整词标示,其中义项⑴⑵是词素义,义项⑶是词义。 【呝】:“〈书〉⑴同‘呃’(è)。⑵形容鸟鸣声。”按:该例是整词标示,其中义项⑴是异体字,义项⑵是词义。 书语词的现实性与通用性 书语词特点:使用范围是书面语;来源是文言词语。 这两个特点都掩盖不了书语词是属于断代共时状态的词语的事实。现实性与通用性应该是书语词所应具有的基本特性。书语词必定会在现实语言生活中呈现一定的使用频率。因此,通过词频调查,能实现对标书词的“现实性”与“通用性”的了解。 二.标书词的词频调查与分析 词频调查所用语料: 现当代文学作品,7000万字,涵盖了现当代文学265位作家的 343部长篇和3829篇短篇作品,包括小说、剧本、讲义、散文、杂文、诗歌等题材。 低频词量多,频次低; 高频词量少,频次高。 支持数据: 第一组:“平均数”与“中位数”的明显差距。平均数是52.12,中位数是17,说明是少数词的高频率把平均数拉上去了。 第二组:“百分比”的分布。从低往高处算起,在等距的百分比中,愈是低位的百分比频距愈小, 词频四分位数统计 低频词 无一词频者:204条 骈阗、膺选、喧豗、萱堂、儇佻、谱牒、酦醅、勖励、讯步、诮呵、牙侩、崖略、皮傅、狉獉、狉狉、披怀,等 词频为1者: 谐戏、重趼、奥博、佻薄、刑辱、俦类、商兑、佻巧、弋获、驰骛、驰目、欣忭、颓放、瀼瀼、穰穰、荏弱、蜷局、潭府、岁杪,等。 词频为2者: 践诺、枭将、参错、阆苑、悠谬、廓张、并骨、弇陋、笃志、魁元、怏然、津梁、诧愕、杳渺、蠡测、伶俜、荫翳、炳蔚、沮遏,等。 词频为3者: 厕足、赅括、仓禀、湔洗、剿袭、鹣鲽、蔼蔼、谙练、听讼、倜然、讹夺、傥荡、探胜、陂塘、佛戾、岁除、笔受、拂煦、俎上肉,等。 低频词基本丧失了“当代性”与“通用性”。 除极少数以外,大部分已经退出了现代汉语的使用范围。 中频词 中频词的频次范围在5-49之间,下面是频次为30的词,共25条: 恢恢、逋逃、不韪、粲然、昌言、芳邻、父执、赴敌、率尔、强颜、漪澜、秉烛、鸿儒、宅第、噍类、阑干、离析、受业、挞伐、怃然、宵旰、修明、羞赧、延揽、苟同。 高频词分析 词频数在50次以上(限高是5000)。居于中位的是词频为100次。词频数在99~103次之间的有16个词: 陵寝、人杰、归田、何谓、进谗、倍道、子虚、教化、更始、恻隐、羁縻、艳羡、行囊、不才、旧家、手谕。 上面的词频分析,反映了低频、中频、高频三类在现实语料中的生疏与熟知情况。至少可以说,500余条的低频词已基本丧失了生存能力。中频词、高频词则得到了相当语言事实的支持。 对低频词的思考 《现汉》对标书词的处理尚存在些许疏漏。主要表现为两点: 一是对非“词”的标注; 二是大量低频词的存在; 低频词显示它们没有现实语言事实的支持。 如何准确地认识

文档评论(0)

zhonglanzhuoshi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档