评估大型语言模型在解决简单编程任务中的有效性-一项以用户为中心的研究-计算机科学-大语言模型-AI辅助编程.pdfVIP

下载本文档

0
0
约2.14万字
约 6页
2025-07-26 发布于北京
举报
版权申诉

评估大型语言模型在解决简单编程任务中的有效性-一项以用户为中心的研究-计算机科学-大语言模型-AI辅助编程.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

评估大型语言模型在解决简单编程任务中的

有效性：一项以用户为中心的研究

KaiDeng

PineViewSchool

Osprey,FL,USA

yingkai.deng8@

摘要—随着大型语言模型（LLMs）在教育工具和编程环境差异。理所当然地认为，当教师是AI时[9]，这一情况

中的普及，关于这些系统应如何与用户互动的问题也随之浮现。也同样适用。这项研究受到一个简单问题的启发：如果

本研究调查了使用ChatGPT-4o的不同交互方式（被动、主动我正在学习编码，哪种类型的AI交互实际上可以帮助

和协作）对简单编程任务的用户表现的影响。我进行了一项被试

本我提高？如果让AI等待我请求帮助、自动提供建议还

内实验，十五名高中生参与其中，在三种不同版本的模型下完成

译了三个问题。每个版本都设计为表示特定风格的人工智能支持：是像解决问题伙伴一样与我互动，哪一种更好？这些不

中仅在询问时回应、自动提供建议或与用户互动对话。定量分析表仅仅是设计问题——它们也是教育问题。随着LLMs在

1明，协作交互方式显著缩短了任务完成时间，优于被动和主动条课堂和自我学习环境中越来越普遍，了解它们提供的支

v件。参与者还报告称，在使用协作版本工作时满意度更高，并感持方式至关重要。为了探索这一点，我设计了一个被试

4觉更有帮助。这些发现表明，LLM的沟通方式、指导、提示和内实验，在该实验中15名高中生使用ChatGPT-4o的

0响应如何能够有意义地影响学习和表现。这项研究强调了设计超

4三个不同版本解决了三个编程任务。每个版本代表了不

0.越功能正确性的LLMs的重要性，以支持更互动、适应性和用同的交互风格：被动（仅在请求时提供帮助）、主动（自

户中心体验，特别是对于初学者程序员而言。

0IndexTerms—大型语言模型（LLMs）、AI辅助编程、交动化建议）和协作（对话与共同推理）。我收集了绩效

5互风格、以用户为中心的评估数据和用户反馈，以评估哪种方式最有效，以及它如何

:影响参与者的感觉。虽然先前的研究表明LLMs可以支

iI.介绍持编程教育[10],[11]，但本研究重点在于这种支持的形

r式如何影响结果和体验——这是一个长期以来被忽视

a大型语言模型（LLMs）正在迅速改变人们学习编

的问题。

码的方式。像ChatGPT[1]这样的工具，经过大量自

然语言和编程示例数据集的训练，现在可以解释概念、

A.相关工作

生成代码、回答问题，甚至帮助调试——所有这些都通

过对话界面[2],[3]完成。这些模型在教育环境中越来先前的研究探讨了大型语言模型（如ChatGPT）如

越常用[4]，为学生提供按需支持，这种体验更像是导何影响学生处理编程任务的方式。Sun等人(2024)[12]，

师而不是教科书。随着这一转变的持续进行，一个关键例如，研究了ChatGPT的存在如何改变了大学生在编

问题出现了：这些工具应该如何与用户互动才能最有效程作业中的行为、信心和表现。虽然他们的研究为用户

地发挥作用[4],[5]？目前关于LLMs的研究大多数集中感知和技术工具使用模式提供了有价值的见解，但并未

在拥有像ChatGPT这样的工具是否能提高

您可能关注的文档

MMMOS-多领域多轴音频质量评估-计算机科学-机器学习-音频质量评估.pdf

以患者为中心的 RAG 用于肿瘤科就诊辅助根据渥太华决策指南进行操作-计算机科学-大语言模型-检索增强生成辅助系统.pdf

文档评论（0）

zikele + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

评估大型语言模型在解决简单编程任务中的有效性-一项以用户为中心的研究-计算机科学-大语言模型-AI辅助编程.pdfVIP