中文词汇切分对眼动数据影响.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文词汇切分对眼动数据影响

中文词汇切分对眼动数据的影响   摘 要:该研究使用眼动研究中的“边界”技术范式,材料中的关键词为前两个字为双字词的三字词,如“服务员”,和非三字词,如“服务体”,考察可能存在的中文词汇切分策略对眼动时间指标的影响。实验使用2×2被试内设计,第一个因素是三字词的词频:高频和低频,第二个因素为不同词频条件下的非三字词基线。实验结果是三字词预视条件下的注视时间短于非三字词预视条件下的注视时间。结果表明自然阅读中的词汇切分策略确实存在,并且可以在眼动的时间指标上表现出来,结果还暗示在词汇切分过程中,读者在心理词典中对三字词的搜索是必需的过程。   关键词:中文阅读;眼动;词汇切分   中图分类号:B842.5文献标识码:A 文章编号:1003-5184(2008)02-0041-08      1 引言      中文文本和英文文本的一个显著不同是英文词汇之间有一个可见空格,而中文词汇之间并没有任何可见的分割标记。当人为去掉英文文本中词与词之间的空格,阅读速度会减为正常阅读的一半[1,2]。如果用随机字母填充英文文本中的空格,阅读也会变得困难[3,4]。因此英文的词间空格可以帮助读者进行阅读。研究者认为,英文词间空格的重要性体现在两个方面:1)词间空格可以帮助读者辨认当前正在注视的词汇,提高了词汇在心理词典中搜索的速度[5];2)词间空格标示了下一个词的空间位置,读者可以通过副中央窝的加工把下一个注视点定位到下个词的最佳注视位置[6,7]。一般认为中文读者为了理解一个中文句子,应该自己把中文词汇从一系列汉字中切分出来,如“要避免草率的行为”这句话中的关键词“草率”的第一个汉字为“草”,如果简单的激活“草”这个单字词的语义,对读者理解整句话并没有帮助,有可能还会干扰句子的理解。有研究表明,在中文词汇间人为加入空格既没有提高阅读速度也没有降低阅读速度[8],实验的数据说明中文自然阅读中的词汇切分过程并不存在。但导致这个结果的原因也有可能是:词间空格消除了词汇切分,增加了阅读速度,但是空格也把下一个词推到了离注视中心较远的位置,减少了对下一个词的预视,从而降低了阅读速度,因此不能在最后的眼动指标上看到词汇切分的影响。这就意味着可能无法通过插入词间空格的方法,在整个材料的眼动数据上分析中文词汇切分的影响。   由于中文的独特性,中文在阅读中的眼动指标上有一些和英文不同的特点:1)知觉广度不同。英文的知觉广度为注视点左侧3~4个字母到注视点右侧14~15个字母[9];但是中文的知觉广度要小一些,为注视点左侧1个汉字到注视点右侧2~3个汉字[10,11]。2)平均眼跳距离不同。英文的平均眼跳距离为7~9个字母,而中文的平均眼跳距离为2.6个汉字[12]。3)英文的词间空格可以引导注视点落在单词的最佳注视位置(一个单词的最佳注视位置为这个单词的中心偏前一点)[13],而中文由于没有词间空格,使得中文读者很难把注视点定位到一个中文词汇的最佳注视位置[14,15]。中文加工和英文加工在眼动数据上的差异应该是由于中文的词长比较短、字形比较复杂。   在正常阅读条件下,中英文阅读中的眼动数据也有很多类似的方面。有研究表明中文双字词的词频会影响在这个词上的注视时间,高频词上的注视时间比低频词上的短,并且高频词汇比低频词汇更容易被跳过[16];中文双字词在句子中的预期(即句中关键词前的部分对这个关键词的预期)也会影响在这个词上的注视时间,高预期词上的注视时间比低预期词上的注视时间短,并且高预期词比低预期词更容易被跳过[17]。但这些研究都是基于中文双字词的,并且假设词汇切分在不同条件下有相同的作用。为了研究词汇切分的策略,还应该研究词汇长度大于2的词汇,表1给出了《人民日报》的词频统计,这个统计是在超过七千四百万词汇的语料基础上,对五万三千多个不同词汇进行分析得到的。      在普通文本中,95%以上的词汇都为单字词和双字词,三字及三字以上的词汇不到5%,五字以上的词汇占的百分比小于0.01%。由于四字及四字以上的词汇大都由单字词、双字词和三字词复合而成,且大都为成语和熟语,因此在词汇切分的研究上,可以暂时忽略四字及四字以上的词汇,先研究单字词、双字词和三字词的切分方式。   为了进行中文眼动的研究,需要借鉴相关的英文研究,其中最重要的参考是英文阅读中的眼动控制模型。阅读中的眼动研究主要是考察外显的眼动行为和大脑内部语言加工的关系[9],经过大量基础研究,在上个世纪末,一些研究者开始提出阅读中的眼动控制模型。其中最重要的两个阅读中眼动控制模型是:EZ读者模型[18-20]和SWIFT模型[21,22]。这两个模型有很多相似的地方,特别是对眼跳潜伏期和注视时间的解释上。   Becker等人在1979年使用双步刺激范式(doubl

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档