新编医学计算机信息应用14.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

课程名称

新编医学计算机信息应用

授课章节

第14章机器学习及医学应用

授课专业

授课班级

实施日程

第周——第周

授课时数

2

教学目标

知识目标

1.理解机器学习基础概念:核心术语(数据集、样本/示例、属性/特征、训练集/测试集);机器学习定义(通过先验信息优化模型,即?\(M1=T(M0,E)\))及基本思路(训练集→算法→目标函数→测试集)。2.掌握核心算法与模型:监督学习:k-近邻(kNN,分类用投票法、回归用平均法)、决策树(分类/回归树,基础算法ID3/C4.5/CART)、贝叶斯模型(基于概率分布,含朴素贝叶斯)、支持向量机(SVM,二分类,最大化间隔超平面);无监督学习:k-均值聚类(k-means,按距离划分簇)、主分量分析(PCA,降维,保留高方差方向)。

3.掌握医学应用流程:监督学习解决问题步骤(划分训练/测试集→训练模型→测试评估→预测新样本);能复现乳腺癌诊断案例(用kNN算法处理《乳腺癌诊断数据集》,计算预测准确率)。

4.了解算法适用场景:区分监督学习(带标签数据,如疾病诊断)与无监督学习(无标签数据,如患者数据聚类)的应用差异。

育人目标

1.培养机器学习思维:建立“数据→模型→预测”的逻辑链条,适配医学中“临床数据→诊断模型→疾病预测”的需求。

2.提升数据驱动决策能力:通过算法对医学数据的分析,学会用模型结果支撑结论,契合医学诊断“证据导向”的严谨性要求。

3.强化跨学科创新意识:结合乳腺癌诊断等案例,体会机器学习在医学诊断、数据挖掘中的价值,激发“医学+AI”交叉领域探索兴趣。

4.树立严谨治学态度:在模型训练与评估中,重视数据划分、参数设置的规范性,避免因操作失误影响结果可信度,贴合医学工作“零差错”标准。

教学重点

1.核心算法原理:k-近邻(kNN)的“邻居投票”逻辑、k-均值聚类的“距离划分簇”思路、PCA的降维原理。

2.监督学习流程:训练集/测试集划分、模型训练(fit())、预测(predict())、评估(accuracy_score())。

3.医学案例实践:用kNN算法处理乳腺癌诊断数据集,完成数据预处理(删无关列、拆分特征与标签)、模型构建与准确率计算。

教学难点

1.算法核心逻辑理解:

?支持向量机“最大间隔超平面”的数学内涵;

?贝叶斯模型中先验概率、后验概率的转换关系。

2.算法选择与参数调优:根据医学任务(如分类/聚类/降维)选择适配算法,理解kNN中k值(邻居数量)对预测结果的影响。

3.医学数据预处理:处理数据集的无关特征(如乳腺癌数据中的ID列)、标签编码(如“M/B”诊断结果)等关键步骤。

教学方法

讲授法:系统讲解算法原理与术语,结合通俗类比(如k-均值聚类“物以类聚”)降低理解难度。

案例驱动法:以乳腺癌诊断案例为核心,串联监督学习流程与kNN算法应用。

对比法:对比监督学习(带标签)与无监督学习(无标签)的适用场景,区分各算法的核心优势(如SVM适合小样本、PCA适合高维数据)。

演示法:屏幕演示乳腺癌诊断案例代码运行过程,直观展示数据处理、模型训练与评估的全流程。

教学用具

电脑、投影仪、多媒体课件、教材

教学设计

考勤→互动导入→传授新知→课堂讨论

教学过程设计

(一)课程导入

提问:“如何利用569例乳腺癌细胞活检数据,构建模型预测新患者的肿块是良性(B)还是恶性(M)?”引出机器学习“用数据训练模型实现预测”的核心作用,导入本节课主题。

(二)理论讲授

模块1:机器学习概述

1.核心术语:用“乳腺癌数据集”举例,说明数据集(569例样本)、样本(单例活检数据)、属性(细胞核半径/质地等30项指标)、训练集(用于建模)、测试集(用于评估);

2.定义与思路:讲解

(通过先验信息E优化初始模型M0得到M1),结合“用部分患者数据训练模型,预测新患者病情”说明机器学习思路。

模块2:监督学习算法

1.k-近邻(kNN):

?原理:找测试样本的k个最近训练样本,按“投票法”(分类)/“平均法”(回归)预测;

?示例:k=3时,若3个邻居中2个为“M”,则预测为恶性。

2.其他算法:

?决策树:模拟人类级联决策,如“先看细胞核半径→再看光滑度”判断良恶性;

?SVM:在特征空间找超平面,使两类样本间隔最大,适合小样本诊断;

?贝叶斯模型:用“先验概率→后验概率”计算,如基于历史数据概率预测疾病。

模块3:无监督学习算法

1.k-均值聚类(k-means):

?原理:随机选k个簇中

文档评论(0)

xiadaofeike + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8036067046000055

1亿VIP精品文档

相关文档