- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
新解放学校2022-2023学年高一下学期4月月考
语文
现代文阅读(27分)
(一)现代文阅读Ⅰ(本题共3小题,12分)
阅读下面的文字,完成1~3题。
材料一:
美国科技公司OpenAI旗下的智能聊天工具ChatGPT火了,它能响应用户需求,做出“类似人类的反应”,能有逻辑性地回答问题、撰写文章,进行分析。这款和以前不一样的聊天机器人迅速收获大量用户,被形容为“久违的现象级消费产品”。
产品火了,仿冒者也来了。市场上已经冒出多种产品,每一个都宣称自己就是ChatGPT。与真正致力于人工智能研究的公司不同,仿冒者有的表示自己是调用了美国ChatGPT的接口,在免费对话额度用完之后,便开始提示用户需要收费,借此捞金。有的则完全是打着ChatGPT旗号的“山寨”,聊天能力却和ChatGPT相去甚远。这种山寨版聊天机器人质量低,用户体验也差,很容易让普通人对该领域产生误解。
节选自《科技日报》
材料二:
ChatGPT的训练过程主要分为以下几个阶段:
GPT3.5本身很难理解人类不同类型指令中蕴含的不同意图,也很难判断生成内容是否是高质量的结果。为了让GPT3.5初步具备理解指令的意图,首先会在数据集中随机抽取问题,由人类标注人员给出高质量答案,把人工标注的问答和对话数据作为监督数据来微调GPT3.5模型。第二阶段主要通过在数据集中随机抽取问题,使用第一阶段生成的模型,对于每个问题,生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。接下来,使用这个排序结果数据来训练奖励模型(RM)。对多个排序结果,两两组合,形成多个训练数据对。RM模型接受一个输入,给出评价回答质量的分数。这样,对于一对训练数据,调节参数使得高质量回答的打分比低质量的打分要高。第三阶段进一步采用PPO,(Proximal Policy Optimization,近端策略优化)强化学习来优化策略。这一阶段利用第二阶段训练好的奖励模型,靠奖励打分来更新预训练模型参数。在数据集中随机抽取问题,使用PPO模型生成回答,并用上一阶段训练好的RM模型给出质量分数。把回报分数依次传递,由此产生策略梯度,通过强化学习的方式以更新PPO模型参数。
摘编自《ChatGPT发展历程、原理、技术架构详解和产业未来》
材料三:
过去几年,类ChatGPT技术已经得到深入研究,ChatGPT通过产品方式展现在大众面前。ChatGPT的突然爆火意味着人机交互走出了技术深闺,标志着以大模型为核心的智能计算范式的确立,敲开了通用化人工智能大门。近年来,以GPT-3、ChatGPT为代表的大模型技术所取得的显著成果表明,增大模型规模和数据规模是突破现有人工智能技术应用瓶颈行之有效的方法。ChatGPT的成功标志着从以专用小模型训练为主的“手工作坊时代”到以通用大模型预训练为主的“工业化时代”的人工智能研究范式转变。
这一转变具有十分重要的意义。通过先进的算法架构、尽可能多的数据,汇集大量算力,集约化的训练模式,由此得到的通用大模型可在广泛应用场景下通过极低代价的模型微调实现高性能的任务适配,使人工智能技术的先进能力更好、更有效地应用到各个场景里面,从而,大大降低开发成本,加速产业发展。ChatGPT的出现为人工智能产业注入了新的活力,同时也极火地促进了通用化人工智能的发展。
《中科院之声》节选
材料四:
类似GPT-3的大型语言模型都是基于来自互联网的大量文本数据进行训练,能够生成类似人类的文本,但它们可能并不总是产生符合人类期望的输出。事实上,它们的目标函数是词序列上的概率分布,用来预测序列中的下一个单词是什么。
但在实际应用中,这些模型的目的是执行某种形式的有价值的认知工作,并且这些模型的训练方式与期望使用它们的方式之间存在明显的差异。尽管从数学上讲,机器计算词序的统计分布可能是建模语言的高效选择,但人类其实是通过选择最适合给定情境的文本序列来生成语言,并使用已知的背景知识和常识来辅助这一过程。当语言模型用于需要高度信任或可靠性的应用程序(如对话系统或智能个人助理)时,这可能是一个问题。
尽管这些基于大量数据训练的大模型在过去几年中变得极为强大,但当用于实际以帮助人们生活更轻松时,它们往往无法发挥潜力。大型语言模型中的一致性问题通常表现为:提供无效帮助,没有遵循用户的明确指示。内容胡编乱造,虚构不存在或错误事实的模型。缺乏可解释性,人们很难理解模型是如何得出特定决策或预测的。内容偏见有害,一个基于有偏见、有害数据训练的语言模型可能会在其输出中出现这种情况,即使它没有明确指示这样做。
《ChatGPT背后的技术工作原理》节选
1.下列对材料二相关内容的理解,不正确的一项是(3分)
A.ChatGPT主要通过“监督策略模型、训练奖励模型、用PPO强化学习来优化策略”这三个阶段的训练实现
您可能关注的文档
- (以此为准2)高一语文 答案.pdf
- 16.2《六国论》课件53张 2022-2023学年统编版高中语文必修下册.pptx
- 2023届高考语文复习:小说专题训练——分析原因.docx
- 2023届河北省石家庄市部分学校高三二轮复习联考(二)语文答案.pdf
- 2023届四川省成都市列五高级中学校高三下学期三诊模拟考试语文试题(Word版含答案).doc
- 2023年高考语文经典作文素材之中华名人故事集锦 专题03 名人的治学之道、欧阳修的文章与友情、古人如何看待李白.docx
- 2023年高考语文经典作文素材之中华名人故事集锦 专题06 书院巷里识了翁、魏源和《海国图志》、知县魏源与“魏公堤”、李白三谢不能餐.docx
- 2023年高考语文经典作文素材之中华名人故事集锦 专题09 如山有岳左宗棠、积善清洁侯太守、晏殊和范仲淹.docx
- 2023年高考语文经典作文素材之中华名人故事集锦 专题12 循吏黄霸的治郡之才、耿直为官的宋璟和海瑞的兴国岁月.docx
- 2023年高考语文经典作文素材之中华名人故事集锦 专题14 孟夫子的“槎头鳊”、 “战神”薛仁贵、徐孺子吊师.docx
最近下载
- 金融风险管理 课件 第7章 流动性风险的度量和管理.pptx
- Q/GDW 10176-2017-(代替Q/GDW 176-2008) 架空平行集束绝缘导线低压配电线路设计规程.pdf VIP
- 抖音运营干货分享量化打造百万级抖音账号矩阵附抖音基础课件.pptx VIP
- 2024年专升本高等数学复习练习题(带答案).pdf VIP
- 大凤凰维修及保养.ppt VIP
- 高一物理必修一加速度.pdf VIP
- Q∕GDW 10784.2-2017 配电网工程初步设计内容深度规定 第2部分:配网电缆线路.docx VIP
- 健康体重的维持和日常管理.pptx VIP
- 斯坦福手术室应急手册中文版.pdf VIP
- 诊断学课件 第5讲 心脏检查基础 视诊、触诊、叩诊、听诊.pptx VIP
文档评论(0)