- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
研究生机器学习课教学反思
一、教学基本信息
这学期我承担了计算机学院研究生《机器学习理论与实践》课程的教学任务。授课对象是28名研一学生,其中15人本科为计算机专业,7人为数学与应用数学专业跨考,4人为电子信息类专业。课程总学时32节(每周2次,每次2学时),采用周志华教授的《机器学习》作为主教材,补充《PatternRecognitionandMachineLearning》部分经典章节,并结合近三年顶会(如NeurIPS、ICML)论文整理了12个前沿专题讲义。教学场地以智慧教室为主(配备多屏互动系统),实验环节在学院AI实验室完成(安装Python3.9、TensorFlow2.10、PyTorch2.0等环境)。
开课初期我做了份学情问卷,发现学生编程基础分化明显:8人熟练使用PyTorch实现神经网络,5人仅能完成简单的Python脚本;数学基础方面,12人对概率论与凸优化有扎实理解,7人需要重新复习矩阵求导和梯度下降原理。这些信息为后续教学调整提供了重要依据。
二、教学目标
课程定位是“理论奠基+实践导向”,目标分三个层面:
(一)知识目标
学生需掌握机器学习核心算法(如决策树、SVM、随机森林)的数学推导与适用场景,理解深度学习(CNN、RNN、Transformer)的网络架构设计逻辑,熟悉强化学习(DQN、PPO)的马尔可夫决策过程建模方法,同时了解迁移学习、联邦学习等前沿方向的研究进展。
(二)能力目标
重点培养“模型设计-调参优化-问题诊断”的全流程能力。具体要求能独立完成数据预处理(缺失值填充、特征工程)、选择或改进算法解决实际问题(如图像分类、推荐系统)、通过可视化(Loss曲线、特征重要性图)分析模型瓶颈,并撰写规范的实验报告。
(三)素养目标
希望学生建立“数据驱动+理论支撑”的研究思维,养成严谨的学术态度(如重视消融实验、避免过拟合陷阱),同时通过小组合作培养跨学科沟通能力——比如计算机背景的学生需要向数学背景的同学解释工程实现细节,数学背景的学生则需帮助队友理解公式背后的直观意义。
三、教学重难点
(一)教学重点
算法原理的深度解析:比如讲解SVM时,不仅要推导拉格朗日对偶性,更要让学生理解“最大间隔”为何能提升泛化能力;讲Transformer时,需拆解自注意力机制如何捕捉长距离依赖。
理论与实践的衔接:例如学完反向传播算法,必须通过动手实现一个简单的全连接网络,观察不同激活函数(SigmoidvsReLU)对训练速度的影响。
前沿与经典的平衡:在打好经典算法(如K-means、朴素贝叶斯)基础的同时,用20%课时介绍大模型(LLaMA、ChatGPT)的训练策略与应用挑战。
(二)教学难点
高维抽象的数学理解:部分学生对“核函数将低维不可分数据映射到高维”的几何意义感到困惑,尤其是涉及再生核希尔伯特空间(RKHS)时,容易陷入公式推导而忽略直观解释。
学生背景差异的调和:数学专业的学生能快速推导梯度下降的收敛性,但面对“如何用PyTorch加载自定义数据集”这类问题时手足无措;计算机专业的学生操作软件熟练,却常跳过损失函数的设计逻辑直接调参。
实践中的“伪创新”陷阱:部分小组为了“创新”而强行修改算法(比如给决策树随机添加无关特征),忽视了“改进需有理论依据”的基本要求,需要反复纠正。
四、教学方法
为应对上述挑战,我采用了“分层递进+多元互动”的教学策略:
(一)启发式讲授:从问题到原理
摒弃“公式堆砌”的灌输式教学,每讲一个算法先抛出现实问题。比如讲K-means时,用“如何根据用户消费数据划分会员等级”引入,让学生先尝试画草图设计聚类规则,再对比标准算法,最后讨论“初始质心选择对结果的影响”。讲到梯度消失时,我用Excel模拟了一个3层Sigmoid网络的反向传播过程,学生亲眼看到“第一层梯度只剩0.001”的结果,比单纯讲数学证明更有冲击力。
(二)案例研讨:用真实数据说话
选取Kaggle竞赛的经典数据集(如Titanic生存预测、房价预测)作为研讨案例,要求学生分组完成“数据探索-特征工程-模型训练-结果分析”全流程。课上留出30分钟进行“模型PK”:一组展示用随机森林得到82%准确率的方案,另一组用XGBoost优化特征交叉后提升至85%,全班一起讨论“提升是来自算法优势还是特征处理”。这种“实战感”让学生深刻体会到“数据质量比模型复杂度更重要”。
(三)项目驱动:解决真实场景问题
期末大作业要求“用机器学习方法解决一个实际问题”,题目由学生自拟。有的小组选了“基于医疗影像的肺结节检测”(与附属医院合作获取脱敏数据),有的做“新闻文本的情绪分类”(爬取某论坛评论)。我要求每组提交“问题背景-技术路线-实验记录-结论与不足”的报告,并录制5分钟视频演示模型效果
原创力文档


文档评论(0)