如何测试ChatGPT的语义理解与常识推理水平——兼谈大语言模型时代语言学的挑战与机会.pdfVIP

如何测试ChatGPT的语义理解与常识推理水平——兼谈大语言模型时代语言学的挑战与机会.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

专题研究二语言智能

如何测试ChatGPT的语义理解与常识推理水平?

*

——兼谈大语言模型时代语言学的挑战与机会a

袁毓林

999078

(澳门大学人文学院中国语言文学系澳门;

北京大学中文系/中国语言学研究中心北京100871)

提要ChatGPT等大语言模型在语义理解和常识推理方面表现优秀,其技术奥秘在于模型开发者在对词语进行

向量表示时,遵循分布式语义学原理,采用了“嵌入”这种代数方法。但是,经典的测试语言运用等智能水平的

“图灵测试”,难以识别欺骗和回避等作弊手段,因此,计算机科学家设计了“新图灵测试”,其中的威诺格拉德

模式挑战与语言学关系密切。这一模式以代词消歧为测试点设计句子对和问题,但是经过大规模语料训练的语言

模型可以凭借词汇上的统计相关性,而不是靠真正理解句子的意义来给出正确答案。为克服这一缺陷,学者们又

发展出WinoGrande数据集,提高了数据的规模和难度,确保它们无法通过网络搜索等手段来得到正确答案。我

们用威诺格拉德模式设计了无偏向双重句子对测试ChatGPT,展示了大语言模型在语义理解和常识推理方面已达

到接近人类的水平。当然,从具身模拟假说来看,大语言模型不可能像人一样富有体验性地理解人类自然语言。

最后,我们呼吁:语言学家应该积极参与构建WinoGrade测试集之类的工作,在人工智能时代扩展自身的学术研

究领域。

ChatGPTWinoGrande

关键词;大语言模型;新图灵测试;威诺格拉德模式挑战;数据集

---

H002A20961014202401004915

中图分类号文献标识码文章编号()

DOI10.19689/10-1361/h

HowtoTestChatGPT’sPerformanceinSemanticUnderstandingandCommon-SenseReasoning:

ChallengesandOpportunitiesofLinguisticsintheEraofLargeLanguageModels

YuanYulin

AbstractThispaperexaminestheapproachestotesttheperformanceofChatGPTinsemanticunderstandingandcommon-

sensereasoning.ItfirstreviewstheremarkableperformanceofChatGPTandotherlargelanguagemodels(LLM)in

semanticunderstandingandcommon-sensereasoning,andexplainshowtheyusedistributionalsemanticsandtokenvector

representationstoprocesslanguage.Then,itcritiquestheclassical“TuringTest”andintroducessomealternativenewt

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档