- 3
- 0
- 约4.18千字
- 约 8页
- 2026-06-20 发布于广东
- 举报
大语言模型(LLM)基础认知备考资料
适用场景:AI基础考核、大模型入门认证、技术岗笔试面试、人工智能通识考试
备考核心目标:掌握LLM基础定义、核心原理、技术架构、训练流程、特性局限、应用场景及基础行业常识,覆盖90%基础考点
第一章大语言模型核心基础概念(高频考点)
1.1LLM定义与本质
定义:大语言模型全称LargeLanguageModel(LLM),是基于海量文本数据、依托Transformer深度学习架构训练的生成式自然语言处理模型,是通用人工智能的核心基础模型。主流代表包括GPT系列、BERT、LLaMA、文心一言、通义千问、DeepSeek等。
核心本质(必考):本质是概率预测模型,核心逻辑为根据已知上下文文本,逐Token预测下一个出现概率最高的字符,实现文本的连续生成,可通俗理解为“智能文字接龙系统”。
核心特征:输出逐Token生成、无原生真实记忆、无自主意识、无法直接执行外部操作、高度依赖上下文与提示词。
1.2核心基础术语
(1)Token(令牌)
LLM处理文本的最小基本单元,并非固定对应汉字/字母。中文多以单字、词语拆分,英文多以单词、词根、词缀拆分。Token是模型输入输出、算力消耗、上下文窗口统计的核心单位。
(2)Tokenizer(分词器)
文本预处理核心工具,负责将人类自然语言转换为模型可识别的Token序列,同时可将模型输出的
您可能关注的文档
- 人工智能训练师考试|算法基础入门学习笔记(考点版).docx
- 人工智能训练师考试学习:人工智能行业政策解读(必考考点版).docx
- AI模型训练基础教程(人工智能训练师考试专用).docx
- 人工智能训练师考试高频考点速记(终极冲刺版).docx
- 人工智能训练师考试|通用AI基础备考题库(全题型带解析).docx
- 人工智能训练师考试|人工智能发展史速记本(必考极简版).docx
- 人工智能训练师考点速记(考前高频必背).docx
- 人工智能训练师考试|零基础通关备考全攻略.docx
- 人工智能训练师职业技能等级认定考核方案(官方标准完整版).docx
- 人工智能训练师高频真题考点解析(必考精简版).docx
原创力文档

文档评论(0)