大模型AIGC问答17:大模型上下文窗口是什么?如何突破窗口限制.docxVIP

  • 3
  • 0
  • 约4.22千字
  • 约 8页
  • 2026-06-22 发布于河南
  • 举报

大模型AIGC问答17:大模型上下文窗口是什么?如何突破窗口限制.docx

大模型AIGC问答17:大模型上下文窗口是什么?如何突破窗口限制

一、核心问答正文

问题1:什么是大模型上下文窗口(ContextWindow)?核心定义

上下文窗口是大模型单次推理能够读取、记忆、参考的最大Token总量上限,是大模型的短期工作内存,也是决定模型长文本理解、多轮对话连贯性、长文档分析能力的核心硬件级+架构级限制。

简单来说:模型每一次生成回答时,只能看见窗口范围内的内容,窗口外的历史信息会直接丢失、无法参与语义推理,这也是大模型“聊着聊着失忆”“长文本后半段失效”的核心原因。

关键必考知识点:上下文窗口总量=用户输入提示词+历史对话内容+模型本次输出内容,三者共享同一窗口配额,并非只计算输入内容。

通俗类比

上下文窗口相当于AI的单次工作台台面,台面尺寸固定(4K/8K/32K/128KToken),台面能摆放的资料总量有限。新内容不断放入时,旧内容会被挤出台面,AI就会遗忘早期信息,台面越大,长文本处理、长对话记忆能力越强。

问题2:什么是Token?Token与汉字、上下文窗口的换算关系

Token是大模型唯一识别的最小语义计算单元,可以是单个汉字、字母、单词、标点、词根、符号,所有文本都会被Tokenizer分词器转化为Token序列后输入模型。

通用行业换算标准(面试必背)

中文场景:1000Token≈750个汉字(含标点、空格)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档