大语言模型(LLM)基础认知备考资料.docxVIP

  • 3
  • 0
  • 约4.18千字
  • 约 8页
  • 2026-06-20 发布于广东
  • 举报

大语言模型(LLM)基础认知备考资料.docx

大语言模型(LLM)基础认知备考资料

适用场景:AI基础考核、大模型入门认证、技术岗笔试面试、人工智能通识考试

备考核心目标:掌握LLM基础定义、核心原理、技术架构、训练流程、特性局限、应用场景及基础行业常识,覆盖90%基础考点

第一章大语言模型核心基础概念(高频考点)

1.1LLM定义与本质

定义:大语言模型全称LargeLanguageModel(LLM),是基于海量文本数据、依托Transformer深度学习架构训练的生成式自然语言处理模型,是通用人工智能的核心基础模型。主流代表包括GPT系列、BERT、LLaMA、文心一言、通义千问、DeepSeek等。

核心本质(必考):本质是概率预测模型,核心逻辑为根据已知上下文文本,逐Token预测下一个出现概率最高的字符,实现文本的连续生成,可通俗理解为“智能文字接龙系统”。

核心特征:输出逐Token生成、无原生真实记忆、无自主意识、无法直接执行外部操作、高度依赖上下文与提示词。

1.2核心基础术语

(1)Token(令牌)

LLM处理文本的最小基本单元,并非固定对应汉字/字母。中文多以单字、词语拆分,英文多以单词、词根、词缀拆分。Token是模型输入输出、算力消耗、上下文窗口统计的核心单位。

(2)Tokenizer(分词器)

文本预处理核心工具,负责将人类自然语言转换为模型可识别的Token序列,同时可将模型输出的

文档评论(0)

1亿VIP精品文档

相关文档