大语言模型调研x-大预言模型工作资源.pdfVIP

  • 0
  • 0
  • 约1.3万字
  • 约 10页
  • 2026-05-20 发布于河北
  • 举报

大语言模型调研x-大预言模型工作资源.pdf

大语言模型调研汇总

一.BasicLanguageModel

基础语言模型是指只在大模文本语料中进行了预训练的模型,未经过指令和下游任

务微调、以及人类反馈等任何对齐优化。

•当前绝大部分的大语言模型都是Decoder-only的模型结构,原因请转移这个问

题:为什么现在的LLM都是Decoderonly的架构;

•大部分大语言模型都不开源,而OPT、BLOOM.LLaMA三个模型是主要面向开源促

进研究和

文档评论(0)

1亿VIP精品文档

相关文档