汉语动宾搭配的自动识别的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动 摘甄 动识 。攀撕蒯腰院蝴碰;垦黧篓自疼㈣n业哪嫦墅 嚏m I啊b本文面向自动向眩分析的实际需要,列j确嘣g【实文本中动宾搭配的自动识别问题进行择滴嘲}研充提出了 “概念+诃语”匹配模型,并在借鉴国外桂日笥【I,毛经验的基础匕j是出“词语+词鼯相似度”计算)甘E型.通过开放测试 植謦拼七b坟了两列喟留鼬々嫂率.韧步显示了实验硪黑联羽俘跏≈值. 关■■句法分析,动划静巳相蛾,部分句j击分析 Ji目啦lHlg钿 N口(b哦埘b目瞳.啪勘豳∞吨L血 抽p坞B嘶吨1∞0舒 翟醯唾是瞄回盥也 舶嗍:hI崎瞒啪讲p∞adt啪商赫a:晒袋vtlb嘞岫妇瞳触啦啊甜哪脯吲帅岫 讨_—矗蠲咖aBo●tt—t矗 旺哪I嘴:ⅦU瑚时Pt-麟r血虹P涮P湘吨 1.引言 动宾结}链svD型语言里普遍存在是句内的踟曲蒯拼隧辐蝣e实的“骨架,,它实际上映 射了整个句子的轮廓。如自g在自动句法分析过程中首先准蒲识别出动宾结构,我们就有可自g在此 基础t进行—些后续分析,从动词出发,向襁索各种状语,i鲕子的主语成分;从宾语出发. 向左搜索各种惨饰戒分.逼近动词,或向右授索其他成分,从而为实珊完全的句法分析奠定一定 的研究基础. 本文所摺的动宾搭配,主要是从位置关系出发,对只带—个体j司性宾语的动词和在句子中位于 其后的体词性名词之间是否能构目2动宾关系进行判定,满足条件的.即认为是台法的动宾搭配。 奉研究得到北京语苦史化大学陈小荷教授的悉心指导,谨毁谢忱. 135 就处理范围而言,我们并不是面向全部动宾搭配。动词和名词的集台是经过甄选后形成的。其中, 动I司蚓氅台我{门没有考虑只膨制、句鞫吾自锈悯、带}lEj吾的动词和带双宾语自嘣间。宾语都是真 宾语。就述宾意义关系而言,宾语既可j龇的施事、受羲也可以是动咋凭措的工具,还可以 觥的结果,或虚移的终点。动:置宾语、时量宾西期媳宾语(即准寅晤)未在本文考虑范围 之内。 掰『增观地“曲-表示具南蚁的名词,斛酌蝻罪『伽上瞄蝴,无法穷尽获】暇.但对 这类名词,使甩奄台饷语义知识就齄把对j倒甚蛐加以懈决。而对褒示抽象意是的名词。我”而以 通过统计等方式进行处理。比如.就“吃”而言,我f『河以比较准确地对其宾j黜行定性描写: 而就“实现?雨言r对它可I黜q宾蕲如。志向”、。志怒一、*禺的、“民主J,、“打算■“政策”、 “口号”、 “路线”等进行描写就不那垂轻松了。 基于以t这种考虑,并结合所选语料的性睫,我们把名词范围调整到以具有抽象意义的名词 为主。目有{蟓意:;c的名词在新闻体语料中大曼存盔,选择处理由这—类名词构成的动宾搭配也 符台语料的实际。虢晰】的初衷是,在避免使用任伺帮泻抽唐噫发名词的语义资源的前提下.通过 构造一窟盼汁舅i;《型,达到对由这瑚谲陶I蒯悯睁瀵}配的自动识剐和标注。为此,我们设计 构造了两种计算慎型。 蕞壅(一)基于动诃溉翻挣苞Ⅺ割峥_目基 —般丽言.构成鲴合型语望关系知讽的双方郝应是语:;c层面上的.我*绷了非完全的语义 限患蟮哩【.梅造了动词橱念和具体名词之问的组合知识。阱名词为出发点,利用名词时能与之构 成动矧胡鼬鸭悯的概念自嗍约关系,检验某硼是否能和谈名词组射蚝趔;的动宾对于。当 某—动词}蔫足该名词列所搭配动词的语望期待时,即为台法的。我们以髑叶黜酾噼海》的动宾 描配为工作平台,以‘知网》为概念资源.构造语义限制模型。 模型(二)莉嚼词浯相似魔婚缎十模型 该模型属基于分布理论的模型。基于分布理论的摸型,其依据是{面刮潲设:一个词的语 义和静赶柏澎淀了它和黼懈勘旨关系。我们借鉴了l∞Dq目m等(1999)所介绍的基于间 语分布的橱以度嗅型(sh岫B触dM。d出)之———混恩溉率嚷型(ConfusionPmbebility 删e1)。该B琶世}慨}式为: Pc(w,·1w.):∑』{;掣.P(w:1w,t)P(m·)。其中,。,、 J

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档