摘要
信息化的发展,信息量的增加,促进了数据挖掘的产生和发展。数据挖掘技
术现在已经在网络搜索、银行业等行业有了非常广泛地应用。数据挖掘相关的算
法有很多,其中聚类分析相关的算法可以分为划分方法、层次方法、基于密度的
方法、基于网格的方法和基于模型的方法。
将基于网格的算法和基于密度的算法相结合,一方面可以满足聚类不同形状
簇的要求,另一方面也能够减少聚类时间。GDD算法在这种思想基础上,将距
离信息特征的思想加入到算法中,考虑簇与簇之间的关系。提高了算法的适应性,
避免聚类陷入局部最优。
本文在介绍数据挖掘基本理论与经典算法的基础上,基于GDD算法提出一
种基于网格和密度的带有层次因子与距离因子的GDLD算法,GDLD算法不仅
具有基于密度算法能够发现任意形状簇的特性,而且在基于网格的基础上能够有
效提高算法效率。层次因子的加入使算法能够更好地体现每个簇内部的密度特
点,同时加}:优化的距离因子,增强了算法反映数据集密度波动性的能力,能够
比较好的适应密度波动比较大的数据集。而且使得算法参数更容易确定,更方便
于应用。
本文用实例说明基于密度的聚类算法适用于根据学生成绩分组的情况,并将
GDLD算法结合网络教育学院的学生信息进行了一定的探索性分析。为今后更深
入的研究学生学习模式提供一定的启发。希望能够使教学管理者更好地了解学生
的学习特点,从而有目的地引导教学。
关键词:聚类分析层次因子距离因子网络教育教学管理
ABSTRACT
Withthe ofInformation andthemcrememof
development technology
been
information has usedintheweb and
content,data widely
mining search,banking
otherbusinesses.Therearelotsof
data-mining
algorithms,andclusteringalgorithm
canbedividedinto
classification,hierarchical
clustering,density-basedclustering,
methodsandmodel-basedmethods.
grid·based
methodand methodnot meetthe
combininggrid—based
Algorithms density only
of differentof alsoreducethe
requirementsclustering shapesgroup,but clustering
time.GDD isbasedonthisidea.Italsotakesthedistanceinformationinto
algorithm
wellasthe betweenclusters.Asa
consideration,as result,GDD
relationship improves
the ofthe andavoids local solution.
adaptab
您可能关注的文档
- 简论上市公司治理结构对战略管理的影响.pdf
- 关于绩效管理的高校中层干部考核机制研究.pdf
- 京沪高速铁路建设管理模式探究.pdf
- 红星现代农业示范区科技管理系统优化地研究.pdf
- 麦肯锡知识管理探究.pdf
- 胜利石油管理局总机厂抽油泵的营销战略与策略.pdf
- 简论管理层收购的法律规制.pdf
- 汽车维修及检测行业管理信息系统.pdf
- 胜任力视角下管理类硕士探究生复试体系探究.pdf
- CS公司全面预算管理应用探究.pdf
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
原创力文档

文档评论(0)