双字组合理解模探索.docVIP

  • 1
  • 0
  • 约9.77千字
  • 约 8页
  • 2016-12-06 发布于贵州
  • 举报
双字组合理解模式探索 王淑华 (上海大学 文学院,上海200444) 提要:新词语不断增加,计算机处理真实文本时不可避免地要面对大量的未登录词。本文认为,从词典中的已登录词出发,描写每个单字的构词属性,如构词时的位置、能产的构词模式、处于不同位置的单字构词时对另一个构词成分在句法和语义上的要求、组合以后的意义理解模式等,有助于计算机准确地识别和理解未登录词。 关键词:双字组合 未登录词 意义组合原理 引言 近年来,随着社会生活、科学技术以及人们思想观念的发展变化,新词语在不断增加。《现代汉语词典》第5版中新增词语有6000余条,而《现代汉语新词语信息(电子)词典》中一共收录了近4万个新词语[1]。事实上,不管工具书、在线词典等规模有多大、更新有多快,都不可能覆盖语言中的全部词汇。计算机在处理真实文本时,不可避免地要面对大量的未登录词。 虽然汉语中的词汇在不断地发展变化,但是用于组词的汉字并没有增加,常用汉字一直有着极高的覆盖率。据冯志伟(1997)统计:2400个常用汉字的覆盖率是99%,3800个常用汉字的覆盖率是99.9%。鲁川(2003)指出:随着信息时代的到来,“新词”和“未登录词”激增,但是“汉字”未增,“这就证明了:汉族人既有用旧字创造新词的能力,又有看旧字懂新词的领悟力”,所以“我国人工智能学者和语言学者要通力合作,让电脑模拟汉族人看旧字懂新词的智力。”

文档评论(0)

1亿VIP精品文档

相关文档