对ChatGPT在数学文字问题上独立评估.pdfVIP

  • 3
  • 0
  • 约3.84万字
  • 约 18页
  • 2026-06-22 发布于北京
  • 举报

对ChatGPT在数学文字问题(MWP)上的独立

评估

*

保罗沙卡里安,纳夫科亚拉穆迪,诺埃尔恩古和拉克什米维哈里

亚利桑那州立大学,699SMillAve,Tempe,AZ,85281,

我们研究了大型语言模型(LLM)ChatGPT在DRAW‑1K数据集上的数学文字问题(

MWP)的表现。据我们所知,这是对ChatGPT的首次独立评估。我们发现,ChatGPT的表

现会根据是否需要展示解题过程而发生显著变化,在解题过程时失败率为20%,而在不提

供解题过程时失败率为84%。此外,关于MWP的几个因素,如未知数的数量和操作的数量,

会导致与先前

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档