大语言模型（LLM）基础认知备考资料.docxVIP

大语言模型（LLM）基础认知备考资料.docx

大语言模型（LLM）基础认知备考资料

适用场景：AI基础考核、大模型入门认证、技术岗笔试面试、人工智能通识考试

备考核心目标：掌握LLM基础定义、核心原理、技术架构、训练流程、特性局限、应用场景及基础行业常识，覆盖90%基础考点

第一章大语言模型核心基础概念（高频考点）

1.1LLM定义与本质

定义：大语言模型全称LargeLanguageModel（LLM），是基于海量文本数据、依托Transformer深度学习架构训练的生成式自然语言处理模型，是通用人工智能的核心基础模型。主流代表包括GPT系列、BERT、LLaMA、文心一言、通义千问、DeepSeek等。

核心本质（必考）：本质是概率预测模型，核心逻辑为根据已知上下文文本，逐Token预测下一个出现概率最高的字符，实现文本的连续生成，可通俗理解为“智能文字接龙系统”。

核心特征：输出逐Token生成、无原生真实记忆、无自主意识、无法直接执行外部操作、高度依赖上下文与提示词。

1.2核心基础术语

（1）Token（令牌）

LLM处理文本的最小基本单元，并非固定对应汉字/字母。中文多以单字、词语拆分，英文多以单词、词根、词缀拆分。Token是模型输入输出、算力消耗、上下文窗口统计的核心单位。

（2）Tokenizer（分词器）

文本预处理核心工具，负责将人类自然语言转换为模型可识别的Token序列，同时可将模型输出的

更多 >