MoE-LLaVA:用于大型视觉-语言模型专家混合稀疏化架构.pdfVIP

  • 1
  • 0
  • 约19.07万字
  • 约 52页
  • 2026-06-22 发布于北京
  • 举报

MoE-LLaVA:用于大型视觉-语言模型专家混合稀疏化架构.pdf

MoE‑LLaVA:用于大型视觉‑语言模型的专家混合

112311411515

崔嘉熙宁沐南

MoE‑LLaVA‑1.8B×4InternVL‑Chat‑19B

文档评论(0)

1亿VIP精品文档

相关文档