- 1
- 0
- 约9.77千字
- 约 8页
- 2016-12-06 发布于贵州
- 举报
双字组合理解模式探索
王淑华
(上海大学 文学院,上海200444)
提要:新词语不断增加,计算机处理真实文本时不可避免地要面对大量的未登录词。本文认为,从词典中的已登录词出发,描写每个单字的构词属性,如构词时的位置、能产的构词模式、处于不同位置的单字构词时对另一个构词成分在句法和语义上的要求、组合以后的意义理解模式等,有助于计算机准确地识别和理解未登录词。
关键词:双字组合 未登录词 意义组合原理
引言
近年来,随着社会生活、科学技术以及人们思想观念的发展变化,新词语在不断增加。《现代汉语词典》第5版中新增词语有6000余条,而《现代汉语新词语信息(电子)词典》中一共收录了近4万个新词语[1]。事实上,不管工具书、在线词典等规模有多大、更新有多快,都不可能覆盖语言中的全部词汇。计算机在处理真实文本时,不可避免地要面对大量的未登录词。
虽然汉语中的词汇在不断地发展变化,但是用于组词的汉字并没有增加,常用汉字一直有着极高的覆盖率。据冯志伟(1997)统计:2400个常用汉字的覆盖率是99%,3800个常用汉字的覆盖率是99.9%。鲁川(2003)指出:随着信息时代的到来,“新词”和“未登录词”激增,但是“汉字”未增,“这就证明了:汉族人既有用旧字创造新词的能力,又有看旧字懂新词的领悟力”,所以“我国人工智能学者和语言学者要通力合作,让电脑模拟汉族人看旧字懂新词的智力。”
您可能关注的文档
- 十个动作让老公不开你.doc
- 十个家长容易犯错.doc
- 十几减9的退位法.doc
- 十佳歌手大赛策.doc
- 十七种美味辣椒的详细做法大全.doc
- 十三十四单元训点.doc
- 十三种洋酒详细绍.doc
- 十四种对人体健有益的花卉.doc
- 十条优秀的“防户流失技巧”.doc
- 十一、教科研工.doc
- 护理伦理教育与案例分析.pptx
- 苏科版数学八年级下册期中仿真模拟卷(一)(解析版).pdf
- 苏科版数学八年级下册期中仿真模拟卷(二)(解析版).pdf
- 湘教版数学八年级下册期中仿真模拟题(二)(解析版).pdf
- 湘教版数学八年级下册期中仿真模拟题(一)(解析版).pdf
- 浙江省杭州市丁荷(丁信)中学2025-2026学年八年级下学期数学期中学情调查(解析版).pdf
- 浙江省兰溪市第二中学2024-2025学年八年级下学期期中考试数学试题(解析版).docx
- 浙江省兰溪市第二中学2024-2025学年八年级下学期期中考试数学试题(解析版).pdf
- 浙江省舟山市2024-2025学年下学期期中数学素养监测试题卷(解析版).pdf
- 浙江省宁波市北仑区精准联盟2024-2025学年 期中质量调研八年级下学期数学试题卷(解析版).pdf
最近下载
- 2025年一级造价工程师《安装计量》猛龙过江口袋书.pdf VIP
- 索尼PMW-RX50使用说明书.pdf VIP
- 一年级数学10以内加减法计算专项练习题(每日一练,共32份).docx VIP
- 2024北京海淀高三一模历史(含答案).pdf VIP
- 完形填空记叙文课件-2026届高考英语二轮复习.pptx VIP
- 一年级数学30以内加减法计算练习题(每日一练,共18份).docx VIP
- 2026秋季国家管网集团甘肃公司高校毕业生招聘考试备考题库(浓缩500题)附答案详解(培优).docx VIP
- 《物理化学》第5章化学平衡.pptx
- 升压站电气安装整套施工记录.docx VIP
- 热射病急诊诊断与治疗:从指南到临床实践.pptx VIP
原创力文档

文档评论(0)