- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于知网的动名语义搭配研究
李新娟刘贵全
中国科学技术人学计算机科学与技术系合肥230027
E—mail:guy@mail.ustc.edu.on;gqliu@ustc.edu.ca
摘要:知网是一个大规模语义知识库。它的字典库和义原库蕴藏了丰富的语义信息。本文利用知网的
三类语义关系:上下位关系、静与动的对应关系、动态相互感应关系,对最基本的动词名词之间的语义搭
配进行了研究,提出一个算法计算动名之间的主谓动宾搭配,以此探讨知网在语义理解中的应用。
关键词:动名搭配知网语义理解 自然语言理解
Verb.Noun
matchbasedonHownet
Li Liu
XinjuanGuiquan+
of Scienceand
DepartmentComputer Technology
ofScienceand of 230027
University TechnologyChina,Hefei,Anhui
E-mail:guy@mail.ustc.edu.cn;gqliu@ustc.edu.cn
Abstract:Hownetisa semantic andmetadativecontain
large-scaleknowledgedatabase.It毒dictionary
richsemanticinformation.Inthis introduceamatch
tothesemanticrelationsinsideHownet,we
paper,according
whethera anda
todecide noun verbmatches.It foundationfortheresearchof
algorithm provides syntaxanalyse
andsentence
understanding.
Words:Verb—NounmatchHownetSemantic NLP
Key understanding
1.引言
一般而言,自然语言理解过程分为四个环节:分词、语法分析、语义分析、语用分析。
目前,基于词典的最大概率法和马尔可夫模型的分词技术已经趋于成熟,分词准确率可达
95%。对于语法分析,利用专家的规则库、词性和最大概率法也可达到较高的准确率,但对
于有语义歧义的句子,语法分析技术很难能得到准确的分析。这时,语义理解必不可少。比
如:“修理自行车的后胎”和“修理自行车的师傅”。这两个短语都对应着线性序列模式M:
“VN的N”,这个序列在句法结构上至少有两种组合的可能性,即A.[V【[N的】N】】和
B.[【【VN】的】N】。要判断一个符合M形式的具体短语到底是按A切分还是按B切分,光靠
组成这个短语的词的句法属性信息是不够的,需要有关于“修理”、“自行车”、“后胎”、“师
傅”等词语的语义知识,即“后胎”是“修理”的【对象】,同时又是“自行车”的【部分】;
“师傅”是“修理”动作的【发出者】,等等。基于这些语义知识,就可以判断出例a应该
按A式切分,例b应该按B式切分。【lj
将一个句子中的实词抽出米进行语义搭配可以解决一些句法分析无法分辨的歧义。词
与词之间的搭配有很多种,如动名搭配、名名搭配、形名搭配等等。动词是句子的核心,这
是国内外语言学者达成的共识。动名搭配是词与词之间很基本的搭配,所以本文从利用知网
进行动名匹配开始,来
原创力文档


文档评论(0)