儿童语料库建设和幼儿词汇语义分类.pdf

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文摘要 个体母语习得实际上表现为个体认知语义网络的建构过程,这一网络的内核 在五岁以前逐步形成。为便于研究,可依据年龄段将五岁前儿童的语义网络划分 为两岁、三岁、四岁、五岁等不同阶段。 作为儿童语义网络建构研究的基础性工作,本研究的主要任务是:1.五岁前 儿童口语语料库的研制;2.幼儿(两岁和三岁儿童)语料的词频统计及普现词提 取;3.幼儿普现词的语义分类;4.义类自动标注方案的制定及其在计算机上的实 现。 第一步,采集儿童口i,-r,-i吾料并转写为电子文本,进行自动分词和词性标注并 辅以人工校对,先后建成含成#,-N-i-孝者语料的A库(113万字)和纯儿童语料的 B库(30万字)。第二步,对B库中两岁和三岁儿童语料进行词频统计,通过与 已有儿童词表的对比,提取出两岁儿童普现词(多种词表共现,在本语料库中频 度较高或多个儿童使用的词)354个和三岁儿童普现词940个。第三步,基于11 个语义大类(人类,事物,时空、行动、状态、属性、数量、限制、情态、功能、 语助)的框架,对两岁与三岁儿童的普现词分别进行语义分类。第四步,制定语 义词类(义类)自动标注方案,研制语义词类自动标注软件(贺胜老师研制), 实现对两岁和三岁儿童语料的初步义类标注。 本研究坚持实地调查和文本采集、人工和机器、比较和分析的方法,研究的 主要成果包括儿童1:2语语料库、幼儿普现词表以及幼儿词汇语义分类框架,其特 色成果“语义词类自动标注软件”及“义类标注儿童语料库”属于原创, 为儿 童语言的语义语法和语义网络建构研究提供了必要工具并奠定了坚实基础。 关键词:儿童语料库普现词语义分类义类标注 ABSTRACT in a of The ofindividualnative is factprocess acquisitionprocess language ofwhichhasbeen semantic COre graduallyconstractingcognitive network,the builtbeforethe offive.Forthesakeofeasein semautie graduallyup age research,the networkcanbe into andfive. divided stages includingtwo-year-old,three,four mtaintasks AsabasicworkofresearchOilchildren’ssemantic ofthis network,the ale笛follows:1.children’s researchand study spoken Go/'pns development;2. language word statisticand occurredwordsextraction;3.semantic frequency commonly classification occurred twoand wordsforchildrenaged three;4.wo

您可能关注的文档

文档评论(0)

hblybd123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档