新编医学计算机信息应用14.docxVIP

下载本文档

2
0
约4千字
约 4页
2025-12-22 发布于陕西
举报
版权申诉

新编医学计算机信息应用14.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

课程名称

新编医学计算机信息应用

授课章节

第14章机器学习及医学应用

授课专业

授课班级

实施日程

第周——第周

授课时数

教学目标

知识目标

1.理解机器学习基础概念：核心术语（数据集、样本/示例、属性/特征、训练集/测试集）；机器学习定义（通过先验信息优化模型，即?\(M1=T(M0,E)\)）及基本思路（训练集→算法→目标函数→测试集）。2.掌握核心算法与模型：监督学习：k-近邻（kNN，分类用投票法、回归用平均法）、决策树（分类/回归树，基础算法ID3/C4.5/CART）、贝叶斯模型（基于概率分布，含朴素贝叶斯）、支持向量机（SVM，二分类，最大化间隔超平面）；无监督学习：k-均值聚类（k-means，按距离划分簇）、主分量分析（PCA，降维，保留高方差方向）。

3.掌握医学应用流程：监督学习解决问题步骤（划分训练/测试集→训练模型→测试评估→预测新样本）；能复现乳腺癌诊断案例（用kNN算法处理《乳腺癌诊断数据集》，计算预测准确率）。

4.了解算法适用场景：区分监督学习（带标签数据，如疾病诊断）与无监督学习（无标签数据，如患者数据聚类）的应用差异。

育人目标

1.培养机器学习思维：建立“数据→模型→预测”的逻辑链条，适配医学中“临床数据→诊断模型→疾病预测”的需求。

2.提升数据驱动决策能力：通过算法对医学数据的分析，学会用模型结果支撑结论，契合医学诊断“证据导向”的严谨性要求。

3.强化跨学科创新意识：结合乳腺癌诊断等案例，体会机器学习在医学诊断、数据挖掘中的价值，激发“医学+AI”交叉领域探索兴趣。

4.树立严谨治学态度：在模型训练与评估中，重视数据划分、参数设置的规范性，避免因操作失误影响结果可信度，贴合医学工作“零差错”标准。

教学重点

1.核心算法原理：k-近邻（kNN）的“邻居投票”逻辑、k-均值聚类的“距离划分簇”思路、PCA的降维原理。

2.监督学习流程：训练集/测试集划分、模型训练（fit()）、预测（predict()）、评估（accuracy_score()）。

3.医学案例实践：用kNN算法处理乳腺癌诊断数据集，完成数据预处理（删无关列、拆分特征与标签）、模型构建与准确率计算。

教学难点

1.算法核心逻辑理解：

?支持向量机“最大间隔超平面”的数学内涵；

?贝叶斯模型中先验概率、后验概率的转换关系。

2.算法选择与参数调优：根据医学任务（如分类/聚类/降维）选择适配算法，理解kNN中k值（邻居数量）对预测结果的影响。

3.医学数据预处理：处理数据集的无关特征（如乳腺癌数据中的ID列）、标签编码（如“M/B”诊断结果）等关键步骤。

教学方法

讲授法：系统讲解算法原理与术语，结合通俗类比（如k-均值聚类“物以类聚”）降低理解难度。

案例驱动法：以乳腺癌诊断案例为核心，串联监督学习流程与kNN算法应用。

对比法：对比监督学习（带标签）与无监督学习（无标签）的适用场景，区分各算法的核心优势（如SVM适合小样本、PCA适合高维数据）。

演示法：屏幕演示乳腺癌诊断案例代码运行过程，直观展示数据处理、模型训练与评估的全流程。

教学用具

电脑、投影仪、多媒体课件、教材

教学设计

考勤→互动导入→传授新知→课堂讨论

教学过程设计

（一）课程导入

提问：“如何利用569例乳腺癌细胞活检数据，构建模型预测新患者的肿块是良性（B）还是恶性（M）？”引出机器学习“用数据训练模型实现预测”的核心作用，导入本节课主题。

（二）理论讲授

模块1：机器学习概述

1.核心术语：用“乳腺癌数据集”举例，说明数据集（569例样本）、样本（单例活检数据）、属性（细胞核半径/质地等30项指标）、训练集（用于建模）、测试集（用于评估）；

2.定义与思路：讲解

（通过先验信息E优化初始模型M0得到M1），结合“用部分患者数据训练模型，预测新患者病情”说明机器学习思路。

模块2：监督学习算法

1.k-近邻（kNN）：

?原理：找测试样本的k个最近训练样本，按“投票法”（分类）/“平均法”（回归）预测；

?示例：k=3时，若3个邻居中2个为“M”，则预测为恶性。

2.其他算法：

?决策树：模拟人类级联决策，如“先看细胞核半径→再看光滑度”判断良恶性；

?SVM：在特征空间找超平面，使两类样本间隔最大，适合小样本诊断；

?贝叶斯模型：用“先验概率→后验概率”计算，如基于历史数据概率预测疾病。

模块3：无监督学习算法

1.k-均值聚类（k-means）：

?原理：随机选k个簇中

您可能关注的文档

文档评论（0）

xiadaofeike + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：8036067046000055

1亿VIP精品文档

更多 >

新编医学计算机信息应用14.docxVIP