高中信息技术浙教版:3-1 对数据进行挖掘:知识挖掘-教学设计.docx

高中信息技术浙教版:3-1 对数据进行挖掘:知识挖掘-教学设计.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

教学设计

课程基本信息

学科

信息技术

年级

高二选必4

学期

秋季

课题

3.1对数据进行挖掘:知识挖掘

教学目标

1.感受聚类算法对无标签数据进行处理的目的与意义。

2.通过实践探究,验证K-means聚类算法的过程并能对生活中的无标签数据进行聚类分析。挖掘其价值。

3.认识到人工智能算法对于数据处理的作用和合理利用人工智能算法的必要性。适应的课程标准:

4.2通过剖析具体案例,了解人工智能的核心算法(如K-means聚类等),熟悉智能技术应用的基本过程和实现原理。

4.3知道特定领域(如机器学习)人工智能应用系统的开发工具和开发平台,通过具体案例了解这些工具的特点、应用模式。

教学内容

教学重点:

1.理解k-means聚类算法思想。

2.能计算二维,多维节点间的距离。

3.选择合适的归一化方法来预处理数据。

教学难点:

1.k-means算法的思想。

2.二维,多维节点间的距离计算。

教学过程

一、情境导入

学习小组分组:

陈老师计划成立信息学习小组,为了避免组间成绩差异过大,在进行分组时,除了采取抽签的方式之外,在抽签之前也会对所有学生进行分档。正常情况下,同一档的学生不会出现在同一个小组,即每个小组4个学生会分别来自不同的档次。

若现有19名学生的3次信息考试的排名数据,要将学生分成3档,应该如何完成这项任务?

二、提出问题

问题研究:沈奕与哪些同学分为一类?

数据挖掘(DM):从海量数据中发现隐性模式或隐含知识的计算过程,它主要用来进行知识发现(KDD)。

三、新知讲授

表格中的数据存在哪些问题?

思考:每个维度取值范围不一样,如何处理?(归一化)

思考:用什么作为分类标准呢?

思想:物以类聚,人以群分,我们可以把挨得近的数据点聚在一起,形成一个类别。

思考:多维度距离如何计算?欧式距离

聚类:按照某个特定的标准(如距离)将一个数据集划分为不同的簇,使得同一个簇的数据的相似性尽可能大,不同簇的数据的差异性尽可能大。

(1)抽象建模

问题简化:两个特征维度的聚类问题。

(2)学生活动

【学习任务一】

①手动聚类

要求:将坐标系中的15个数据点,圈画2个分组。

【学习任务二】

②聚类计算

要求:随机取两个点p1和p2,分别计算其余点到两点之间的距离。

【学习任务三】

③精调分类

要求:对新的聚类分组求出新的中心点的位置p1’和p2’。

P1’=____________

P2’=____________

(三)算法描述

①随机设置K个点作为初始的聚类中心。

②对于其他每个点计算到K个中心的距离,将其归属到与其距离最近的一个中心并标记类别。

③对标记为一类中所有数据计算他们的平均值,作为新的中心点。

④如果计算得出的新中心点与原中心点不再变化或者变化很小,那么结束,否则重新执行②③两步。

(四)实践活动

【学习任务四】

补充完整Python程序,验证用K-means聚类算法实现数据聚类的过程。

思考:对于三个特征变量的数据,如何进行数据挖掘?

课堂小结

K-means聚类特点:算法原理简单、算法可解释性强;在大型数据集上可以快速高效并行处理;需要提前知道K值(K值不好把握),初始点的选取会影响聚类结果。

你觉得聚类算法可以为我们提供哪些帮助?

五、知识拓展

无监督学习——关联规则(Apriori算法)

还记得“啤酒与尿布”这个故事吗?还记得必修一项目与挑战:“为超市寻找关联次数最多的商品”中超市流水账数据吗?

除了k-means聚类算法外,还有频繁子集挖掘算法,发现数据中频繁出现的信息,即挖掘信息之间的关联性,比如商店想要知道哪些货品组合经常被顾客购买,以此来决定商品的进货量、进货时机和商品摆放等。还记得“啤酒与尿布”这个故事吗?还记得必修一项目与挑战:“为超市寻找关联次数最多的商品”中超市流水账数据吗?这个需要运用频繁子集挖掘算法。

例如,某商店整理了一天内4名不同顾客购买的商品数据,希望通过频繁子集挖掘找到商品之间的相关性信息。

您可能关注的文档

文档评论(0)

K12教育资源 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年02月03日上传了教师资格证

1亿VIP精品文档

相关文档