- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九讲现代科学技术和对外汉语教学- 现代科技有关的中文信息处理
(3)句处理:包括句子成分残缺或多余的错误标注,各种特殊句式的错误标注,语序、动词重叠、句式杂糅、未完句等方面的错误标注,以及各种句子错误的数据统计。 面向语言学研究的汉语语料库检索系统 语言学研究需要以语言事实作为依据。 过去主要通过研究者用卡片大量摘录语言材料,这种方法因受到数据规模的限制而效率较低。 近十几年出现了大量的电子文档,可以组成大规模的电子语料库,并出现了相当成熟的文本信息检索技术。 效率高,可以在极短的时间内,在大规模电子语料库中找到相关文本的文章、段落、句子;结果可以编辑、复制、打印;查询表达式可以是关键词语同逻辑符号组合成的复杂的关系式。 面向语言教学研究的汉语语料检索系统CCRL 单位:北京语言大学 简介: 北京语言大学在国家863计划、国家自然科学基金和教育部项目的支持下,研制成功。 CCRL软件系统已经对8亿多字的各种文体的汉语文本语料库建立了字索引和多种词语属性索引,词语属性包括语法、语义、语音、构词等方面,并已取得多项有意义的研究成果。CCRL网络测试版已在北京语言大学语言信息处理研究所网()发布,全球的用户都可自由使用。 教育部科技发展中心 /cn/gxzxjdcgjj/axkfl/jsj/webinfo/2004/02/1179971250769742.htm CCRL汉语检索通 汉语教学多媒体素材库和资源库 对外汉语教学多媒体素材库,存储的是汉语教学所用的形形色色的基本“元件”,教师可以根据自己的设想或者根据他人所提供的“图纸”,搭建成自己所需要的教材或者课件,形成配合课堂教学使用的或者在网络上供学生使用的教学资源。各种各样的素材库便构成了理想的教学资源库。 汉语国际教学推广资源库 单位:武汉大学汉语国际推广教学资源研究与开发基地 特点: 旨在建设超大容量、自动组配、满足需求的教学资源库及网络平台; 研发汉推紧缺教学资源产品; 构建汉推教学资源评价体系; 提供教学资源建设策划和咨询服务; 打造面向世界的汉语国际推广教学资源研发中心。 语料库总结 现代汉语语料库 现代汉语句型语料库 汉语中介语语料库 面向语言学研究的汉语语料库检索系统 汉语教学多媒体素材库和资源库 3.3.3 应用性 根据对外汉语教学的学科任务,决定了这一门理论与实践紧密结合、具有极强实践性的应用学科。 作为教学活动的对外汉语教学必须理论与实践相结合。一线教师积累有丰富的教学经验,可以补充丰富教学理论;新加入的高学历教师则需要教学法的学习,在教学中理论指导实践。 本学科研究方法的特点要进行科学实验,获得数据,进行定量、定性分析,从而得出客观的、有说服力的结论。 3.3 对外汉语教学的学科特点 多语种的平行语料库 指的是在两种或两种以上语言之间进行的语料采 集和加工。 如: “双语对齐语料库”,包括篇章级对齐、句子级对齐和正在研究的多次表达对齐(短语级对齐)。 法国国家科研中心的“圣经语料库”,收集各种不同语种和版本的圣经进行对比研究。 正在建设北京大学汉英双语平行语料库,除了篇 章、句子对齐还在做短语对齐,提取短语对齐词表。 ⑦监控语料库 具备及时更新和自动监控的语料库,能够自动淘汰过时的语料,不断自动选择新语料,增加新语料,及时发现、及时报告语言应用中出现的新现象、新变化。对术语、新词语、词语使用状况的动态研究、词典编纂等非常有用。 Cobuild语料库就是一个监控语料库(monitor corpus),加进了一个动态元素,新文本被源源不断地加进去,通过软件分析识别和发现新词语和词汇的新用法。每周向其电子邮件用户发送一份word watch邮件,报告流通中用语的动态变化。 2001年全球英语监控语料库(the global English monitor corpus)项目启动。目的是报告不同国家英语变化的趋势。 ◇语料库的发展 对于语料库的发展阶段,学界存在三分法(何婷婷、黄昌宁、李涓子、詹卫东等)或六分法(张普等)等几种观点。 综合各种分法,可以看出语料库发展经历了漫长的人工语料库时代和迅猛发展的电子语料库时代,其中电子语料库时代按时期、语料、数量、加工深度、文本方式、应用领域等又分为前期电子语料库时代、中期电子语料库时代、后期电子语料库时代和超后期电子语料库时代 ⑴ 人工语料库时代 在计算机技术运用于语言研究之前,特别是20世纪60年代以前,研究者也有语料库,只是规模小、范围窄,且基本上是单语种语料库,仅用于面向语言的研究领域。这样的语料库虽然是机器不可读的,但是却是现代语料库的雏形,为现代语料库的建立和发展奠定了基础。 在国外,人工语料库曾广泛使用于语言习得、方言学、语言教学、句法和语义及
文档评论(0)