汉语语篇中人称指代消歧探究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第22卷增刊 江西师范大学学报(自然科学版) V01.22.Sup. 1998年10月 JOURNAI.oFJⅫGⅪNoRMALUNIvERSlTY0ct.1998 汉语语篇中人称指代消歧研究· 谌志群周昌乐郑洪 杭州太学计算帆系58#.杭州,310028 搐要?本文首先分折了汉浯语篇申的人称指代髓律.然后给出了“关注焦点”集的 概念及“关注焦点”集的计算方法,在此基础上,提出了一种基于“关注焦点”集计算的人 称撞戗担蛀簋莺.该算法充分利用了汉语语句级的语义信息,并反映了汉语的指代援律-在 我们小规模的实验中,取得了91%的消歧成功翠,初步反跌了该算法的可行性. 关键字:自然语言理解,汉语,人称代词,指代消歧 。 l 中图法分类号:TP39 语篇是最高一级的语言单位,语篇一般由多个句子组成,但语篇不是多个句子的简 单罗列,语篇中旬与旬之问必须有衔接成分,在语义上必须连贯.作为语篇衔接与连贯的 重要手段之一,指代(Anaphora)是指在语篇中用一个指代词回指某个以前说到过的语言 单位.当指代词是人称代词时我们称之为人称指代.人称代词指代的一般都是名词或名词 词组.消除人称代词的指代歧义是自然语言语篇理解的一项重要内容.所谓消除歧义也就 是一个替换过程,即用人称代词指代的语言单位替换人称代词,使得计算机对语句和语篇 的语义处理能够进行下去.本文提出了一种基于“关注焦点”集计算的人称指代消歧荒略, 并给出了消歧算法.实验的结果是令人满意的. 1汉语人称指代分析 现代汉语中的人称代词主要有:我、你、他、她、它、我们、你们、他们、她们、它 们等.人称代词又分为第一人称代词(我、我们)、第二人称代词(你、你们)和第三人 称代词(他、她、它、他们、她们、它们).第一人称“我”在语篇中往往指说话者.或 者指代作者(比如在第一人称写法的记叙文中),或者指代语篇中的说话者(“我”出现在 直接引语中).“我们”是复数形式,指比多个说话者,有时还可将听话者包括在内.第二 人称指听话~方,单数用“你”,复数用“你们”.第三人称指说话者和听话者以外的一方. 单数用“他”、“她”、“它”,复数加“们”.“他”指男性,“她”指女性,“它”不指人而 指物.吖电们”可专指男性.也可兼指男性和女性,“她们”专指女性,如果男女兼有可 以写成“他们”. 2 “关注焦点”集及其计算 在语篇中,无论是陈述和说明的对象,还是动作的施与者与承受者都是名词、名词词 组或其指代词,因此它们应成为语篇生产者(作者/说者)和语篇消费者(读者,听者)共同关 注的中心.由于名词和名词词组在语句中的句法功能不同,其被“关注”的程度也就不同.名 ’浙江省自然科学基金项目资助 , 谌志群等汉语语篇中人称指代i《歧研究 t998年 词和名词词组在语句中可充当主浯、宾语和其它成分(辅助语).为了反映名词和名词词 组的被“关注”规律,我们为充当主语、宾语或辅助语的名词和名词词组分别设定一个权 的是主语、宾语和辅助语之间相对的被“关注”程度.三个递减数值序列反映的居随着语 甸的推移,充当主语、宾语和辅助语的名词和名词词组被“关注”程度的递减.这些权重 序列是经验数值,可以根据实验情况进行调整. 为了量化名词和名词词组的被“关注”程度,我们分别为备名词和名词词组计算一个 积分,以积分高低作为其被“关注”程度的度量.权重序列是计挥积分的基础.当一个名 词或名词词组第一次出现在一条语句中时,根据其充当的句子成分将相应权重序列的第一 个值赋给它作为其积分.如果在接下来的句予中该名词或词组不再出现,则其积分按其权 重序列递减.但如果该名词或词组又出现了,则其积分在顺序递减的基础上还要根据它在 此句中的成分累加上相应的权重. 一般来说,在语篇的任一点(即语句)上总有若干个积分大于0的名词或名词词组.我 们将积分大

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档