- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
基于附码语料库的对外汉语教学知识挖掘研究
盛 玉 麒
250100 济南山东大学中文信息研究所
Email:yuqisheng@163.com 电话:0531H)O)
提要
本文运用语料库语言学的理论和方法,论述了汉语的特点和对外汉语教学面临的知识短缺以及基于附码语料库进行汉语知识挖掘的可行性,重点介绍了本文所采用的语料库加工后的主要属性数据库的类型和特点,从词语动态频度、兼类词分布、词语搭配及句法模型等方面,介绍了对外汉语教学知识挖掘的类型和具体方法。
关键词:语料库 对外汉语教学 知识挖掘
Study on Knowledge Mining
for Teaching Chinese as a Foreign Language Based on Annotated corpus
Pro. Sheng Yuqi
(Chinese Processing Institue of Shandong University, Jinan, Shandong, PRC, 250100)
Email: yuqisheng@163.com Phone: 86+0531H); 86+0531O)
Abstract:
This paper inquiries into the characteristics of Chinese language, the knowledge shortage encountered in teaching Chinese as a foreign language and the feasibility for knowledge mining based on annotated corpus. It lays emphases on introduction to styles and characteristics of attributive database adopted after knowledge processing. It also offers an introduction to styles and methods for knowledge mining in teaching Chinese as a foreign language in terms of word dynamic frequency, homonym distribution,word collocation as well as syntactic models.
Key Words: Corpus ;Teaching Chinese as Foreign Language ;Knowledge Mining.
一、导言
对外汉语教学面临诸多知识短缺的问题,一方面是因为汉语本身的复杂性和汉字记录汉语过程中的噪音干扰与信息缺失所致,另一方面是因为长期以来汉语的研究、工具书和教材的编写几乎都是面向母语学习者的,即使是名之为对外汉语教学的,也多以低年级母语学习者的读本为参照,所以,教和学都陷入的境地。
权威的汉语教科书讲解词类划分标准的时候,都以会说汉语为前提,例如:“形容词一般能受程度副词修饰”、“动词后面可以带动态助词”、“及物动词能带宾语”、“不能重叠”……等等。试想,对于外国学习者来说,根本不懂汉语,自然不知道词与词之间能否搭配。所以,这种讲解对他们来说毫无用处。
正如维特格斯特说的那样,“用法即意义”。汉语词语究竟有多少种用法谁也说不清楚,但是,可以肯定地说远远超出静态的词典工具书所描述的范围,从发展的观点看,更是如此。因此,基于语料库的汉语知识挖掘就显得十分必要。特别是对外汉语教学领域,要解决所遇到的知识短缺的问题,唯有从现代汉语流通语料库中挖掘,舍此没有其他捷径可走。
这里说的知识挖掘并不是增加对外汉语教学的内容和知识量,而是提高教学效果,把最简明、最实用、最有规律的知识找出来教给学生。
二、汉语知识短缺与对策
1.词汇语义知识短缺
汉字数量繁多、结构复杂、理据多样、信息冗余、读写繁难;同音、谐音、连读音变影响词汇语义的理解和运用;有声语言中的语调、节奏、轻重音等都因为汉字无法记录而被忽略。常常会遇到“听—说”的时候没有歧义,用汉字写出来再念的时候,就有了歧义,如“喝口水”绝不会听成“喝/口水”,却很可能被留学生们读错。
字义笼统,随词而变;词义模糊,随句再变;二语习得者茫然难得要领。同一个字用在不同的语句中,意义改变很大。有些表面上看起来词形类似,却不能望文生义、随意类推,如:
“妈妈═妈”、“爸爸═爸”、“哥哥═哥”;
“爷爷≠爷”、“老爷爷≠爷爷”、“老公公≠老公”。
“有没有关系——有关系——没关系——
文档评论(0)