网站大量收购闲置独家精品文档,联系QQ:2885784924

文本连贯中的常识推理研究.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文本连贯中的常识推理研究.pdf

文本连贯中的常识推理研究④ 冯志伟 教育部语言文字应用研究所 北京 100010 zwfengde@public.bta.net.cn 摘要:文本连贯是自然语言计算机处理必须解决的问题,本文研究了基于推 理的判定算法,给出了一些有趣的实例。本文着重指出,尽管能够阐明连贯确立 问题的计算模型是非常重要的,但是这样的方法和其他类似的方法很难用于覆盖 范围广泛的应用领域。特别是,大量的公理需要对世界中所有必需的事实进行编 码,并且缺少利用这种大规模公理的集合进行约束推理的鲁棒的机制,这使得这 些方法在实践中几乎无法实施。因此,这个问题是一个“AI完全问题”(AI—com— plete),也就是“人工智能完全问题”。“AI完全问题”来自计算机科学中的术语“NP 能够利用这些知识的问题。这样的问题当然是非常困难的,目前还解决不了。笔 者特别强调,本文中讨论的问题还是非常初步的,希望引起对于HNC有兴趣的专 家的注意。 关键词:文本连贯,AI完全问题,NP完全问题,话语结构 文本连贯是自然语言计算机处理必须解决的问题,在本文中,我们将研究基 于推理的判定算法,给出了一些有趣的实例,并指出这个问题是一个“AI完全问 题”,是一个本质上需要人类拥有的所有知识并能够利用这些知识的问题,因此, 我们的研究是非常初步的。 文本连贯现象 假如你随意收集一些结构良好并可独立理解的语段,比如,从《红楼梦》的每 一章中随意选择一个句子,然后把它们排在一起,那么,你获得的是一个可以理 ①本文得到国家社会科学基金资助,项目号03BYY019。 解的话语吗?几乎可以肯定地说,你得到的这些排在一起的东西是不可能理解的。 其原因在于,你把这些句子并列在一起时并不能体现出它们之间的连贯关系(CO— herence)。 在机器翻译中,文本连贯的研究也是非常重要的。我们来看下面的例子: was had his hefound Little lost train.Thenit.It Johnnyveryupset.He toy in washis pen. 这个例子与巴希勒(Bar—Hilled在机器翻译的早期举出的例子很接近。如果机 器翻译的程序不能判别前面句子与单词pen的连贯关系,那么,就难以确定pen的 含义应该是“游戏的围栏”,因而也就不可能得到正确的译文。 在汉英机器翻译中,也需要研究文本的连贯问题。 例如,下面两个汉语段落: 小王是医生。今天他做了手术。 小王得了阑尾炎。今天他做了手术。 在这两个段落中,前句的主语都是“小王”,后句的主语都是“他”。使用所指 判定的方法,我们可以判定:后旬中的“他”的所指就是“小王”,但是,在所指判 定之后,后句“今天他做了手术”仍然存在两种可能性,“他”(指“小王”)究竟是自 己做给别人做手术(“他”是施事者),还是别人给他做手术(“他”是受事者),这种 歧义的判别依赖于“他”的身份,如果“他”是医生,那么给别人做手术的可能性就 比较大,从而可判定“他”是施事者;如果“他”不是医生,那么,被别人做手术的 可能性就比较大,从而可判定“他”是受事者。而要正确地判别后句中“他”的身份, 必须分析在这些话段中前后句子之间的连贯关系。 在第一个段落中,因为该段落的第一个句子“小王是医生”为第二个句子“今天 他做了手术”提供了关于小王身份的信息,根据这样的连贯关系,可以把这个段落 翻译为: Little isa he an Wangdoctor.Todayperformedoperation. he an he an performed 这里,“Todayperformedoperation”的意思是“Today forthe operationpatient”(今天他给病人做了手术)。 在第二个段落中,因为该段落的第一个句子说明小王已经得了阑尾炎

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档