- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文的组织结构 开发背景 数据挖掘的概念 数据挖掘的常用方法 关联规则的基本原理 关联规则的算法 专业方向选择系统拟采用的开发平台 关联规则在选择专业方向中的应用 专业方向选择系统的实现 致谢 开发背景 近年来大学生的人数在不断递增,但是质量却在不断下降,其中就是因为没有选择好自己的专业,导致学不好,计算机专业方向有软件和硬件,为了让学生了解到自己适合选择哪个专业方向,我们可以对学生的各科成绩以及科目偏向的方向来进行分析,从大量的数据中找出其中有价值的规律,从而指导学生选择选择最适合自己的专业,这篇文章就是讨论与研究选择专业方向系统的实现。 毕业论文题目:基于关联规则的专业方向选择的设计 学生姓名:朱春年 所在院系:计算机学院 专业:计算机科学与技术 届别:2015届 指导老师:王峻 数据挖掘的概念 数据挖掘,顾名思义就是通过对数据的分析发现一些未被人们所知道的信息,这些信具有某种隐藏的价值。从而帮助人们有效去利用这些潜在价值的数据的过程。它是一种信息处理技术,是从大量的数据中,从不同角度去不断抽取、不断转换、不断分析等处理,从中提取出能辅助各行业决策所需要的数据。它不仅是一个数据处理的过程,而且还是一个行业未来预测的过程。 数据挖掘常用的方法 数据挖掘主要用到的方法有六种,分别是描述统计,关联和相关,分类和聚变,预化,优化,结构与方程化。而不同的方法所用到的地方也是不同的,他们在不同的方面起到同样重要的作用。 关联规则的的基本原理 如果我们设项的集合M={m1,m2,...,mn},设集合N是数据库事务的集合,N中有任务相关的数据,设W是事务,则N中的每个W是项的非空集合,从而W?M。事务N都有自己的标识符,我们称WMN。设一个项集E,若E?W,则事务W就包含E。所以,我们就可以将满足E=F形式的蕴涵式描述为关联规则,其中E?M,F?M ,且E∩F=Φ且E,F都不为空。 关联规则的算法(续) 关联规则算法是用于数据发掘研究众多算法中的其中一种。完成关联规则数据挖掘就是在设定的支持度的最小值情况下,找出所有的满足这个值的频繁项集,根据找出的频繁项集,算出置信度,根据设定的置信度最小值,产生关联规则。我们可以它划分为以下步骤:一是找出数据集D中所有的频繁项目集,根据最小支持度。二是产生关联规则,根据频繁项集和最小置信度。 关联规则的算法(续) 关联规则的Apriori算法是基于递推思想,立足于两个阶段求频繁项集,主要思想如下: 第一步,扫描数据库,统计每一项发生的数目,根据给定的支持数,找出所有满足大于或等于给定支持数的项,获得频繁1项集,记作L1; 第二步,在找出L1后,从L1中找出后选频繁2项集,记作C2;重新扫描数据库,统计每一项发生的数目,找出所有满足大于或等于给定支持数的项,找出频繁2项集,记作L2; * 关联规则的算法(续) 第三步,按照第二步,以这种方式,找出频繁3项集,记作L3; 第四步,按照第三步,循环迭代,如果设我们要找最后频繁k项集,循环直到找不到频繁k+1项集。 * 专业方向选择系统拟采用的开发平台(续) 由于本系统的数据量可能会比较大,且考虑到该系统对安全性要求比较高,对此,我们选用SQL Server 2008作为数据库开发。SQL Server 2008是一种可以存储较大量数据的关系数据库,它在SQL Server 2005的基础上,通过扩展简单的数据加密技术、外键管理技术等提高了系统数据的安全性;它通过改进数据库的镜像、热添加cpu等措施确保了业务的可持续性。 专业方向选择系统拟采用的开发平台(续) 编程语言选择 php是一种通用开源脚本语言,主要适用于Web开发领域。它可以比CGI或者Perl更快速地执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高许多;PHP还可以执行编译后代码,编译可以达到加密和优化代码运行,使代码运行更快。 关联规则在选择专业方向中的应用(续) 原始数据 关联规则在选择专业方向中的应用(续) 根据以上收集到的数据,经过关联规则找出频繁项集,设最小支持数为10,计算置信度结果。 * 关联规则在选择专业方向中的应用(续) 关联规则在选择专业方向中的应用(续) 由以上数据分析可知,专业方
您可能关注的文档
- 电力系统谐波检测和系统的设计分解.doc
- 电力系统灾害预防分解.doc
- 化学药剂MSDS分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第六节素材.ppt
- 精密超精密加工技术分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第三节素材.ppt
- 基因工程的基本操作分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第四节素材.ppt
- 电力线路基础知识分解.doc
- 精密机械设计复习分解.ppt
- 航天军工2024年度策略:需求落地,加速成长(202311).pdf
- 基于对保障性住房的研究:2023房地产长效机制新解.pdf
- 计算机行业数据要素系列报告之三:公共数据授权运营_亟待开发的蓝海(202307).pdf
- 锦囊专家&DIRC:中国数字产业创新研究中心-中国数字化转型与创新评选2018-2022五年对标洞察报告.pdf
- 临床质谱行业白皮书:NGS之后精准医疗新方向,七大技术加速临床质谱国产化.pdf
- 科技行业先锋系列报告60:飞行汽车,未来智能出行方式(202002).pdf
- 华宝新能 深度研究:便携储能龙头,渠道、品牌双翼助翱翔.pdf
- 计算机行业2023年度中期投资策略:技术与政策新周期初现,重视AI数据要素信创三大方向(202307).pdf
- 雷达行业深度报告:相控阵雷达迭代,国产化器件起航(202211).pdf
- 孤独症行业影响力评价报告.pdf
最近下载
- 新能源汽车检测与故障诊断技术实训工单 工单1--4 新能源汽车维护与保养---高压互锁故障诊断与排除.doc
- 中华民族一家亲第一课时.ppt VIP
- 2023—2024学年度第一学期三年级数学寒假作业 .pdf VIP
- 9篇 2025年1月整理 带头带头增强党性、严守纪律、砥砺作风方面存在的问题与不足.doc VIP
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)1.docx VIP
- 心理咨询师十套试题及答案.docx VIP
- 最新外研版三年级起点四年级上册知识点总结(最新最全).pdf
- 华东师大版七年级数学上册举一反三专题4.7动角旋转问题专项训练(原卷版+解析).docx VIP
- (汇编)班子成员2024年带头增强党性、严守纪律、砥砺作风方面存在问题原因分析.doc VIP
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)6.docx VIP
文档评论(0)