- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文本连贯中的常识推理研究.pdf
文本连贯中的常识推理研究④
冯志伟
教育部语言文字应用研究所 北京 100010
zwfengde@public.bta.net.cn
摘要:文本连贯是自然语言计算机处理必须解决的问题,本文研究了基于推
理的判定算法,给出了一些有趣的实例。本文着重指出,尽管能够阐明连贯确立
问题的计算模型是非常重要的,但是这样的方法和其他类似的方法很难用于覆盖
范围广泛的应用领域。特别是,大量的公理需要对世界中所有必需的事实进行编
码,并且缺少利用这种大规模公理的集合进行约束推理的鲁棒的机制,这使得这
些方法在实践中几乎无法实施。因此,这个问题是一个“AI完全问题”(AI—com—
plete),也就是“人工智能完全问题”。“AI完全问题”来自计算机科学中的术语“NP
能够利用这些知识的问题。这样的问题当然是非常困难的,目前还解决不了。笔
者特别强调,本文中讨论的问题还是非常初步的,希望引起对于HNC有兴趣的专
家的注意。
关键词:文本连贯,AI完全问题,NP完全问题,话语结构
文本连贯是自然语言计算机处理必须解决的问题,在本文中,我们将研究基
于推理的判定算法,给出了一些有趣的实例,并指出这个问题是一个“AI完全问
题”,是一个本质上需要人类拥有的所有知识并能够利用这些知识的问题,因此,
我们的研究是非常初步的。
文本连贯现象
假如你随意收集一些结构良好并可独立理解的语段,比如,从《红楼梦》的每
一章中随意选择一个句子,然后把它们排在一起,那么,你获得的是一个可以理
①本文得到国家社会科学基金资助,项目号03BYY019。
解的话语吗?几乎可以肯定地说,你得到的这些排在一起的东西是不可能理解的。
其原因在于,你把这些句子并列在一起时并不能体现出它们之间的连贯关系(CO—
herence)。
在机器翻译中,文本连贯的研究也是非常重要的。我们来看下面的例子:
was had his hefound
Little lost train.Thenit.It
Johnnyveryupset.He toy
in
washis
pen.
这个例子与巴希勒(Bar—Hilled在机器翻译的早期举出的例子很接近。如果机
器翻译的程序不能判别前面句子与单词pen的连贯关系,那么,就难以确定pen的
含义应该是“游戏的围栏”,因而也就不可能得到正确的译文。
在汉英机器翻译中,也需要研究文本的连贯问题。
例如,下面两个汉语段落:
小王是医生。今天他做了手术。
小王得了阑尾炎。今天他做了手术。
在这两个段落中,前句的主语都是“小王”,后句的主语都是“他”。使用所指
判定的方法,我们可以判定:后旬中的“他”的所指就是“小王”,但是,在所指判
定之后,后句“今天他做了手术”仍然存在两种可能性,“他”(指“小王”)究竟是自
己做给别人做手术(“他”是施事者),还是别人给他做手术(“他”是受事者),这种
歧义的判别依赖于“他”的身份,如果“他”是医生,那么给别人做手术的可能性就
比较大,从而可判定“他”是施事者;如果“他”不是医生,那么,被别人做手术的
可能性就比较大,从而可判定“他”是受事者。而要正确地判别后句中“他”的身份,
必须分析在这些话段中前后句子之间的连贯关系。
在第一个段落中,因为该段落的第一个句子“小王是医生”为第二个句子“今天
他做了手术”提供了关于小王身份的信息,根据这样的连贯关系,可以把这个段落
翻译为:
Little isa he an
Wangdoctor.Todayperformedoperation.
he an he an
performed
这里,“Todayperformedoperation”的意思是“Today
forthe
operationpatient”(今天他给病人做了手术)。
在第二个段落中,因为该段落的第一个句子说明小王已经得了阑尾炎
您可能关注的文档
- 文化误读与比较新闻学.pdf
- 文化资本化下的中国城市文化发展道路——循序渐进与平行推进道路选择的浅议.pdf
- 文化遗产价值评价标准EVA指标体系.pdf
- 文化遗产保护与利用的时代性在文化遗产保护与旅游发展国际研讨会上的讲话.pdf
- 文化遗产保护与旅游开发利用的和谐机制研究.pdf
- 文化遗产保护与旅游开发和谐共生机制研究.pdf
- 文化遗产保护和旅游发展共赢文化遗产保护与旅游发展国际研讨会综述.pdf
- 文化遗产保护引出的生态保护问题——以三峡大坝文化遗产保护研究为例.pdf
- 文化遗产地品牌的创立与管理研究.pdf
- 文化遗产地旅游资源价值评估体系研究.pdf
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
文档评论(0)