一个现代汉语语义知识库的初步实现一知识分享.pptVIP

一个现代汉语语义知识库的初步实现一知识分享.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个现代汉语语义知识库的初步实现一知识分享.ppt

实例3: (3-1) [词形]:小偷 [拼音]:xiao3tou1 [制作者]:肖榕 [工作单号]:5 [语义分类]:{人物} [论元数目]: [义项数目]:1 [义项序号]:1 [释义]:偷东西的人。 [词组实例1]:那几个从新疆来的经常在公共汽车站出没的以外地人为偷窃对象的屡次漏网的小偷 [定语1]:那 [语类1]:{D} [槽类型1]:[指量属性] [定语2]:几个 [语类2]:{ML} [槽类型2]:[数量属性] [定语3]:从新疆来(的) [语类3]:{VP} [槽类型3]:[来源] [定语4]:经常在公共汽车站出没(的) [语类4]:{VP} [槽类型4]:[具体物状态] [定语5]:以外地人为偷窃对象(的) [语类5]:{VP} [槽类型5]:[具体物状态] [定语6]:屡次漏网(的) [语类6]:{VP} [槽类型6]:[具体物状态] [槽类型顺序]:[指量属性][数量属性][来源][具体物状态][具体物状态][具体物状态]3 [可能顺序数]:[具体物状态][具体物状态][指量属性][数量属性][来源][具体物状态]3 (实例3 3-2) [词组实例2]:公安局刚刚抓获的一个与当地犯罪集团有密切联系的四处流窜的小偷[定语1]:公安局刚刚抓获(的) [语类1]:{S} [槽类型1]:[来源] [定语2]:一个 [语类2]:{ML} [槽类型2]:[数量属性] [定语3]:与当地犯罪集团有密切联系(的) [语类3]:{VP} [槽类型3]: [具体物状态] [定语4]:四处流窜(的) [语类4]:{VP} [槽类型4]:[具体物状态] [槽类型顺序]:[来源][数量属性][具体物状态][具体物状态] [词组实例3]:电视上通缉的那个身高一米七左右、头发略为卷曲、带农村口音的小偷 [定语1]:电视上通缉(的) [语类1]:{S} [槽类型1]:[具体物状态] [定语2]:那个 [语类2]:{DL} [槽类型2]:[指量属性] [定语3]:身高一米七左右 [语类3]:{S} [槽类型3]:[生理属性] [定语4]:头发略为卷曲 [语类4]:{S} [槽类型4]:[生理属性] [定语5]:带农村口音(的) [语类5]:{VP} [槽类型5]:[人的社会属性] [槽类型顺序]:[具体物状态][指量属性][生理属性][生理属性][人的社会属性] [槽关系表达式联想]:[[指量属性]|[数量属性]][来源][内容结构情节属性] [生理属性]*[人的社会属性]*[具体物状态]* 5 信息处理用现代汉语语义分类词典的研究与实现 研究名词词汇意义的一个方法是语义场方法,即研究词的聚合关系、上下位关系。语义场体现义位的关系和区别,也体现语义的系统性。这个系统性是客观世界的系统性在语义中的反映。研究汉语分类语义场必须先研究汉语语义分析体系。分类的意义和作用在于:分类是人类对事物认识的一种结果,也是人类对事物认识的一种手段。分类法刻划事物简洁、清晰、信息密度大,反映了词汇意义中最基本也是信息量最大的属性。当然并不是说分类可以解决全部的问题。“任何简单的分类、单一的关系描述、完全静态的分析都是无济于事的,必须把多层次、多类型、多关系、多变化这些性质综合加以考虑。”不过分类体系描述既可节省存储空间(下位结点可以继承所有上位结点的语义特征),又可避免单个义项描写时遗漏语义特征或不同人描写出现的分歧。 作者十几年来在研究参考了国内外十来个分类体系和词典优缺点的基础上加上自己的见解初步确定了一个信息处理用现代汉语语义分类体系,并在此基础上、设计和实现一个信息处理用现代汉语语义分类词典管理系统软件,用来对几万词条进行实际分类和代码化组成一个语义分类词典库。词典管理系统主界面包括“创建索引文件”、“批量添加词”、“归类回收站”、“导出节点下的词库”、“整个语义词典词数的统计”、“语义分类各层节点数统计”、“叶结点数统计”等功能,而 “语义树的管理功能” 设计了强大齐全的语义树管理和修改功能,主要包括“添加一个语义分类节点”、“删除当前语义分类节点”、“修改一个语义节点的名称”、“折分当前语义分类节点”、“移动当前语义分类节点”。“词典库管理功能” 设计为主要包括词的查询功能(含“查询语义分类节点下的词”、“查询词的语义分类”、“查询同一语义分类节点的其他词”、“显示暂时删除词选项”)和词的增删改功能(含“添加一个词”、“删除若干词”、“修改词及属性”)。 我们还完成了对7万多汉语词语11万多义项进行机助标注的工作形成语义分类词

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档