《自然语言处理》02-现代语言学基础.pptVIP

《自然语言处理》02-现代语言学基础.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义的表征:预设 * 1 a 阿伦后悔学人工智能 b 阿伦打算学人工智能 c 阿伦喜欢学人工智能 阿伦已经学了人工智能 阿伦现在还没有学人工智能 不清楚阿伦有没有学人工智能 2 a 吴姐:小丁的前女友为什么跟小丁分手? b 阿伦:小丁啥时候有过前女友? 语义的表征:焦点 * a 在昨天的“末庄之夜”晚会上,吴姐甚至吻了阿伦。 b 在昨天的“末庄之夜”晚会上,吴姐甚至吻了阿伦。 语义的表征:主观义 * 1 a 吴姐知道阿伦和小丁都是绍兴人。 b 吴姐过生日,阿伦和小丁都送了礼物。 2 a 吴姐说:阿伦离开老家三天了。 b 吴姐说:阿伦离开老家都三天了。 主观义:三天是一个比较长的时间 主观义:阿伦和小丁 送 礼物,此事非同寻常 语义的表征:构式义 * a 你罚你的款,他违他的章。 b 你走你的阳关道,他走他的独木桥。 c 你说你的,他干他的。 小结:意义到底是什么? * 土豆 = 马铃薯 花果山的美猴王 = 大闹天宫的弼马温 周海婴的父亲 = 许广平的丈夫 “意义组合原则” (principle of compositionality) “意义情境原则” (principle of contextuality) 由内求义 向外求义 2.2.5 语用系统 会话含义理论 指示语分析 ( Levinson, 1983) ( Grice, 1967/1975) 会话含义 a 阿伦在食堂指着空座位问座旁的安德森:这儿有人吗? b 阿伦在饭店指着柜台的调味罐问安德森:这儿有辣椒油吗? a b 会话含义的推理机制 交际“合作原则”(Cooperative principle),具体包括四个准则: (1)适量准则(maxim of quantity):话语提供的信息量要恰当,不多,也不少; (2)保质准则(maxim of quality):话语要真实,不虚假,有证据; (3)相关准则(maxim of relation):话语之间要有关联; (4)方式准则(maxim of manner) :话语要清晰、简短、有序 (Grice, 1967/1975) 会话含义的推理机制 a 有人、有水、有场地、有游泳池 b 有脾气、有钱、有性格、有能力 * 很有人、很有水、很有场地、很有游泳池 很有脾气、很有钱、有性格、有能力 ? ? 有 vs 无 多 vs 少 人、水、场地、游泳池…… 脾气、钱、性格、能力…… 阿伦 有 美元 阿伦 有 钱 阿伦 没有 美元 阿伦 没有 钱 ? * 美元 少 ? 钱 少 指示语分析 – 人称词 我们起不来了,让我们歇会儿吧 我们如果能再坚持一下,就一定能把他救活。 对话 我们:员工甲、乙、丙 我们:管理员、 员工甲、乙、丙 对话场景中的“我们”指谁,要看外部世界的情境,句子中的谓语(如“起不来了”“再坚持一下”等)所述者是谁。 指示语分析 – 时间 今天 工作 不 努力, 明天 努力 找 工作。 你 现在 把 文件 打印出来 交上去。 他 现在 在 纽约 攻读 博士学位。 他们 上周三 约好 这周一 见面 讨论 下下周五 谈判 的 细节 安排。 等 他 拿到 学位 的 时候,我们 的 孩子 差不多 有 两岁 了 。 你 那时候 还 不 到 两岁。 你 那时候 还 不 到 六十岁。 通过这种标注句例,可以观察动词在实际语料中的角色分布规律: “复仇”框架中 表达“惩罚”(Punishment)义的语言形式通常是“by”引导的介词短语, 表达“复仇对象”(Offender)的语言形式一般是“on、with”引导的介词短语。 英语中“伤害行为(Injury)可以直接跟在复仇动词之后,如b句所示。对应到汉语的复仇义动词,则没有这种句法分布形式,汉语不能说“复仇他们上个赛季的失利”。 汉语中通常要采用例c所示的句型,将伤害行为放在介词“为”之后引出,并将整个介词短语放在复仇动词之前,说成“为他们上个赛季的失利复仇”。 该框架中的“复仇对象角色”,在英语中和汉语中,都需要通过介词引出,比如例a用on引出,例c用with引出,汉语中一般用“向”引出。这是英语和汉语的相同点。 可见,利用框架元素的描述方式,有利于比较语言之间在实践语义表达的形式手段方面的异同。 * 语言知识资源:语言学理论的数据化 预训练语言模型也是一种语言知识资源 —— 纯粹基于语言(文本形态)自身分布的数据化 * 语言学概览:1、2、3 语言资源建设:4 语言的起源:5 语言学与形式科学:6 语用学:7、8、9 * * 第2章 现代语言学基础 自然语言处理 提纲 2.1

文档评论(0)

扬州牧 + 关注
实名认证
文档贡献者

资料收集自互联网,若有侵权请联系删除,谢谢~

版权声明书
用户编号:8036120077000004

1亿VIP精品文档

相关文档