- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课程名称
新编医学计算机信息应用
授课章节
第14章机器学习及医学应用
授课专业
授课班级
实施日程
第周——第周
授课时数
2
教学目标
知识目标
1.理解机器学习基础概念:核心术语(数据集、样本/示例、属性/特征、训练集/测试集);机器学习定义(通过先验信息优化模型,即?\(M1=T(M0,E)\))及基本思路(训练集→算法→目标函数→测试集)。2.掌握核心算法与模型:监督学习:k-近邻(kNN,分类用投票法、回归用平均法)、决策树(分类/回归树,基础算法ID3/C4.5/CART)、贝叶斯模型(基于概率分布,含朴素贝叶斯)、支持向量机(SVM,二分类,最大化间隔超平面);无监督学习:k-均值聚类(k-means,按距离划分簇)、主分量分析(PCA,降维,保留高方差方向)。
3.掌握医学应用流程:监督学习解决问题步骤(划分训练/测试集→训练模型→测试评估→预测新样本);能复现乳腺癌诊断案例(用kNN算法处理《乳腺癌诊断数据集》,计算预测准确率)。
4.了解算法适用场景:区分监督学习(带标签数据,如疾病诊断)与无监督学习(无标签数据,如患者数据聚类)的应用差异。
育人目标
1.培养机器学习思维:建立“数据→模型→预测”的逻辑链条,适配医学中“临床数据→诊断模型→疾病预测”的需求。
2.提升数据驱动决策能力:通过算法对医学数据的分析,学会用模型结果支撑结论,契合医学诊断“证据导向”的严谨性要求。
3.强化跨学科创新意识:结合乳腺癌诊断等案例,体会机器学习在医学诊断、数据挖掘中的价值,激发“医学+AI”交叉领域探索兴趣。
4.树立严谨治学态度:在模型训练与评估中,重视数据划分、参数设置的规范性,避免因操作失误影响结果可信度,贴合医学工作“零差错”标准。
教学重点
1.核心算法原理:k-近邻(kNN)的“邻居投票”逻辑、k-均值聚类的“距离划分簇”思路、PCA的降维原理。
2.监督学习流程:训练集/测试集划分、模型训练(fit())、预测(predict())、评估(accuracy_score())。
3.医学案例实践:用kNN算法处理乳腺癌诊断数据集,完成数据预处理(删无关列、拆分特征与标签)、模型构建与准确率计算。
教学难点
1.算法核心逻辑理解:
?支持向量机“最大间隔超平面”的数学内涵;
?贝叶斯模型中先验概率、后验概率的转换关系。
2.算法选择与参数调优:根据医学任务(如分类/聚类/降维)选择适配算法,理解kNN中k值(邻居数量)对预测结果的影响。
3.医学数据预处理:处理数据集的无关特征(如乳腺癌数据中的ID列)、标签编码(如“M/B”诊断结果)等关键步骤。
教学方法
讲授法:系统讲解算法原理与术语,结合通俗类比(如k-均值聚类“物以类聚”)降低理解难度。
案例驱动法:以乳腺癌诊断案例为核心,串联监督学习流程与kNN算法应用。
对比法:对比监督学习(带标签)与无监督学习(无标签)的适用场景,区分各算法的核心优势(如SVM适合小样本、PCA适合高维数据)。
演示法:屏幕演示乳腺癌诊断案例代码运行过程,直观展示数据处理、模型训练与评估的全流程。
教学用具
电脑、投影仪、多媒体课件、教材
教学设计
考勤→互动导入→传授新知→课堂讨论
教学过程设计
(一)课程导入
提问:“如何利用569例乳腺癌细胞活检数据,构建模型预测新患者的肿块是良性(B)还是恶性(M)?”引出机器学习“用数据训练模型实现预测”的核心作用,导入本节课主题。
(二)理论讲授
模块1:机器学习概述
1.核心术语:用“乳腺癌数据集”举例,说明数据集(569例样本)、样本(单例活检数据)、属性(细胞核半径/质地等30项指标)、训练集(用于建模)、测试集(用于评估);
2.定义与思路:讲解
(通过先验信息E优化初始模型M0得到M1),结合“用部分患者数据训练模型,预测新患者病情”说明机器学习思路。
模块2:监督学习算法
1.k-近邻(kNN):
?原理:找测试样本的k个最近训练样本,按“投票法”(分类)/“平均法”(回归)预测;
?示例:k=3时,若3个邻居中2个为“M”,则预测为恶性。
2.其他算法:
?决策树:模拟人类级联决策,如“先看细胞核半径→再看光滑度”判断良恶性;
?SVM:在特征空间找超平面,使两类样本间隔最大,适合小样本诊断;
?贝叶斯模型:用“先验概率→后验概率”计算,如基于历史数据概率预测疾病。
模块3:无监督学习算法
1.k-均值聚类(k-means):
?原理:随机选k个簇中
您可能关注的文档
最近下载
- 第9课《创新增才干》第1框《创新是引领发展的第一动力》同步课堂精品课件-【中职专用】《哲学与人生》.pptx VIP
- DL-T5434-2024电力建设工程监理规范.pptx VIP
- 2013浙G35 预应力离心混凝土空心方桩.docx
- 铜陵学院《面向对象程序设计(Java)》2023-2024学年第一学期期末试卷.doc VIP
- 2023年番茄行业市场前景分析.docx VIP
- 元旦假期温馨提醒60条!.doc VIP
- 过渡金属复合材料制备及其催化MgH2储氢性能研究.pdf VIP
- 人力总监年终总结与规划.pptx VIP
- 江西2021年普高专升本《大学英语》真题及答案.docx VIP
- 第二节 19世纪后期资本主义国家发展趋势.ppt VIP
原创力文档


文档评论(0)