基于关联规则及知识网络专业课程关联分析.docVIP

下载本文档

18
0
约4.48千字
约 10页
2018-07-11 发布于福建
举报
版权申诉

基于关联规则及知识网络专业课程关联分析.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于关联规则及知识网络专业课程关联分析

基于关联规则及知识网络专业课程关联分析　　摘要：以北京联合大学商务学院信息管理与信息系统专业课程为研究对象，通过提取课程大纲内容关键词，应用Apriori算法对课程内容进行关联分析，得出课程关联规则，并建立专业课程知识网络。通过课程关联分析及知识网络分析研究课程之间的相关关系和紧密程度，区分核心课程，划分课程结构，并在此基础上对专业课程设置及改革提出意见与建议。对于专业课程研究及探索具有较强的理论和实践意义。　　关键词：关联规则；Apriori算法；知识网络；专业课程；数据挖掘　　中图分类号：G642.0 文献标识码：A 文章编号：1007-0079（2014）21-0055-03 　　专业课程设置是决定高等教育人才培养质量的重要环节。课程计划是课程设置的整体规划，是实现专业人才培养方案的关键，决定了教学实施的效果和人才培养的质量。课程设置是否合理、课程之间如何关联；如何合理地设置专业课程结构、调整专业课程内容；如何用科学的方法对现有专业课程体系进行关联分析，成为国内高校专业建设与课程改革中极为重要的研究课题。　　本文以北京联合大学信息管理与信息系统专业课程为例，通过提取课程大纲关键词对专业课程进行内容分析，运用Apriori算法发现课程关联规则，并绘制课程知识网络图，在此基础上分析课程的关联程度，区分核心课程与非核心课程，对课程进行紧密度划分，以验证专业课程设置的合理性，为专业课程计划的调整提供针对性的意见和建议。　　一、关联规则及Apriori算法综述　　关联规则最早由Agrawal（1993）等人提出，侧重于确定数据中满足特定要求的不同属性域之间的相互联系。关联规则挖掘过程主要分为三大步骤：①一是求数据库中满足相应阀值的所有的频繁项目集并逐步寻找子集；二是利用挖掘好的频繁项目集生成所有达到相应阀值的关联规则；三是对发掘出来的规则进行可视化处理和评估。关联规则采用的主要算法有：Apriori算法及其衍生算法、增量挖掘算法以及并行挖掘算法等。本文分析的数据集较小且迭代次数不多，因此采用经典Apriori算法对课程进行关联分析。　　Apriori算法是由Agrawal（1994）等人设计并提出的挖掘布尔关联规则频繁项集的一种有效算法。其基本思路是重复扫描数据库，其核心内容是基于频繁项集的一步步推导，首先找出用户设定的minsupport阀值的第一频繁项集L1，使用L1来寻找第二频繁项集L2，然后L2寻找L3，如此反复，直到找不到频繁项集为止。②实施步骤主要分为两步：一是发现频繁项集，如果一个项集是频繁的，则其子集也是频繁的；二是根据所获得的频繁项集寻找符合支持度的关联规则，最后依据设定的置信度指标确定规则。关联规则实质上是在数据库中找出置信度和支持度分别大于等于设定好的相应阀值的规则。　　置信度也称为置信水平（Degree of confidence，简称Dconf），是估计值与总体参数在一定允许的误差范围以内，其相应概率的大小。置信度表示区间估计的把握程度大小，所以要求的把握程度越大，就会得到一个相对宽的置信区间，相应降低了估计的准确程度。在挖掘关联规则时需要自己设定一个最低准确度的数值，用来选取确定关联规则，为决策做依据；对于规则X、Y的置信度的计算公式为：　　（1）　　支持度即被支持的程度（Degree of support，简称Dsupp），即在一个数据集中支持被选数据出现的百分比。对于项集X的支持度公式为：　　（2）　　对于规则X、Y的支持度计算公式为：　　（3）　　以上X、Y为数据项集的子集，则合格规则X→Y（给定最小支持度α和最小置信度β）可以表示为：。　　已有文献对关联规则及Apriori算法的改进及优化研究较多，应用于课程关联分析的文献并不多见，少数文献采用学生成绩或追踪毕业生就业状况来获取数据源，以此推断课程设置的合理性。本文以信息管理与信息系统专业课程为研究对象，采用客观数据即课程大纲提取内容关键词，避免其他主观因素的影响，再应用Apriori算法提取课程关联规则，使分析结果更加客观。　　二、课程关联分析　　1.课程编码及关键词提取　　本文研究对象是专业课程，不考虑基础课和通识教育课，如大学英语、体育等。信息管理与信息系统专业课程主要分为四大类：学科大类必修课、学科大类限选课、专业必修课、专业限选课，本文一共选取了26门专业课程进行关联分析。　　课程大纲是最能客观反映课程内容的规范性文件，从课程大纲中提取关键词可以较为准确地涵盖课程主要内容。本文采用Python语言对26门专业课程大纲进行分词分析，提取高频词作为本门课程的关键词，从分词结果中对每门课程出现频率最高的30个词语进行分析，剔除语义不合理的词汇以及动词、形容词等无法反映课程内容的词汇。考虑到关联规则算法对