一、课程概览
学时:90分钟(2×45′),多媒体教室
先修:完成“RAG系统”实训,会用OpenAIAPI或本地模型进行文本生成。
教学目标
知识:说出多模态五条数据链路“采-编-融-推-馈”;写出LLaVA三组件“视觉编码器-投影层-语言模型”;列举图文交互四步“上传-编码-融合-生成”。
能力:能独立运行一个“图文问答Demo”并替换自有图片;能基于缺陷检测模型加入语音播报函数。
情感:树立“模态互补、体验无界”的设计理念,关注可访问性与包容性。
教学重点:跨模态对齐、图文联合推理、冗余/互补策略。
教学难点:Cross-Attention机制调优、事件驱动融合框架、轻
您可能关注的文档
- AI大模型开发实战 教案 1从AI到大模型:技术跃迁全景速览.docx
- AI大模型开发实战 教案 2大模型开发实战全景.docx
- AI大模型开发实战 教案 3驾驭大模型:提示工程与交互设计实战.docx
- AI大模型开发实战 教案 4RAG系统:让大模型实时调用知识库.docx
- AI大模型开发实战 教案 5智能体开发全景:从架构到协同.docx
- AI大模型开发实战 教案 7大模型重塑金融:从数据到决策.docx
- AI大模型开发实战 教案 8大模型医疗应用全景解析.docx
- AI大模型开发实战 教案 9AI重塑教育:从个性化到全球化.docx
- AI大模型开发实战 教案 10大模型瘦身术:轻量化与部署优化.docx
- AI大模型开发实战 教案 11大模型上线后如何持续进化.docx
原创力文档

文档评论(0)