- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树在研究生就业数据分析中的应用研究
摘要:对于高校研究生就业信息管理系统中积累的大量数据,运用数据挖掘算法中的ID3决策树算法对所给数据进行分类和预测。通过实例给出了该算法在高校研究生就业工作中的应用,找出影响研究生就业的主要因素。挖掘结果表明,该算法在研究生就业数据的分析中的可行性和正确性,并得到若干有参考价值的结论,给广大学生和学校就业决策者提供就业指导。
关键词:数据挖掘;决策树;ID3算法;就业
中图分类号:TP274 文献标识码:A文章编号:1009-3044(2011)19-4673-03
Application of Decision Trees in the Postgraduate Employment Data Analysis
XUAN Shi-li, YANG Qiu-ye
(College of Computer Science and Engineering Information, Guangxi Normal University, Guilin 541004, China)
Abstract: Management system has accumulated college graduates employment information data, id3 data mining algorithm to use in the decisions of the to categorize the data and forecasted. By an example which this algorithm is applied to the employment of the college graduates to find out the main factors affect the post-graduate student employment. Excavation results reveal that this algorithm in analysis postgraduate employment data is feasible and correct and get some reference value conclusion, This conclusion is good for the student employment policy makers and provide employment guidance.
Key words: data mining; decision trees; ID3 algorithm; employment
随着我国高校研究生招生规模不断扩大,研究生的就业形式也不容乐观,毕业生就业方式变得多元化、自主化,高等院校之间的竞争日趋激烈[1]。如何充分利用已有的毕业生就业信息资源,挖掘隐藏在这些数据中的有价值的信息,以使高校在每年的毕业生就业宣传、就业计划投放、学院专业设置等方面做出正确的决策,是摆在高校面前的紧迫课题[2]。数据挖掘技术被广泛用于各种信息的挖掘,尤其是在金融业、商业界上的应用都取得了很好的效果,在教育界的应用还比较欠缺。数据挖掘中的决策树算法,可以发现数据属性间的关系,可以找出哪个属性是分类的主要影响因素。
本文借助计算机专业研究生毕业生的就业信息进行挖掘,运用ID3决策树算法建立决策分类树,找出影响计算机专业研究生就业的主要因素及各因素间的关系,为低届学生提供学习参考,为高校决策者提供就业指导和学生工作建议。
1 决策树技术简介
1.1 基本概念
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是找出一组能够描述数据典型特征的模型或函数,以便能够识别未知数据的归属或类别,分类模型能够通过数据网挖掘分类算法从一组训练集样本数据中学习获得[3]。分类可用于预测,预测的目的是利用历史数据记录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。
1.2 决策树分类
决策树是一种用来表示人们为了做出某个决策而进行的一系列判断过程的树形图。决策树方法的基本思想是利用训练集数据自动地构造决策树,然后根据这个决策树对任意实例进行判定。目前,决策树方法主要用于分类,它提供了一种展示“在什么条件下得到什么值”这类规则方法。决策树具有直观、清晰、易被用户理解的特点,同时,决策树具有容易生成规则、算法可伸缩性强等优点[4]。
使用决策树进行分类,就是在内部结点上选用一个属性进行分割,数据开始都在根结点,递归地进行细分;二是树的修剪,去掉一些可能是噪声或者异常的数据。使用决策树就是对未知数据进行分割,即按
文档评论(0)