高校人事管理数据库技术的应用初步的研究.docVIP

下载本文档

2
0
约4.46千字
约 10页
2018-11-08 发布于福建
举报
版权申诉

高校人事管理数据库技术的应用初步的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

高校人事管理数据库技术的应用初步的研究

高校人事管理数据库技术的应用初步的研究　　摘要：随着计算机技术的进步，许多高校相继建立了日益完善的人事信息管理系统，积累了大量的完整数据。本文以教职工信息库作为基础信息来处理的，通过对整个院系（或学科）的教职工的个人信息进行加工处理、运用统计方法对每一个学科的院系（或学科）分别进行聚合、挖掘。从而找出影响学科发展的因素及各因素间的关联关系。　　关键词：高等学校；人事管理；数据库技术；应用研究　　中图分类号：G203文献标识码：A文章编号：1009-3044(2008)05-10ppp-0c 　　　　1 引言　　　　随着计算机技术的进步，许多高校相继建立了日益完善的人事信息管理系统，积累了大量的完整数据。目前，这些数据的主要用途是向各级管理部门提供各类统计报表和信息查询，但对这些数据所隐藏的价值没有挖掘利用，十分可惜。借用计算机和数据库管理手段，实现人事管理目录信息的计算机化和网络化管理。它包括建立人事档案部局域网环境，加强部门内部人员之间的信息沟通和网络化应用：建立人事管理数据库，实现人事管理目录信息的统一管理：实现对人事管理基本信息的增、删、查、存、转等操作以及统计、打印等功能：采用条码技术实现档案盘点功能：整合现在文件级数据，将单机版数据加载到网络数据库中，实现人事管理数据的集中存放和统一模式的管理。本文以高校人事信息库为对象，研究数据挖掘的方法。以图“透过现象看本质”，找出有价值的信息，为管理决策者提供参考。　　　　2 高校人事管理数据库概述　　　　高校人事信息库是由几个子库组成的，这些子库按照级别分：院系（或学科）信息库和院系的教职工信息库。院系（或学科）信息库称院系情况信息库，它由下列字段组成：学科（或系）代号，学科（或系）名称，学科（或系）在全国的学术排名。建立时间，教职工总数，教学人员编制数，教学人员实有人数。科研人员编制数，科研人员实有数，文献总量，文献购置费，仪器设置总值，大型仪器设备台件数，国家级重点实验室个数，本科生总数，硕士生总数，博士研究生总数，留学生总数，其他学生数，学科带头人年龄，学历、性别等，是院系（或学科）的基本情况库。　　院系（或学科）的教职工信息库是由教职工基本情况库、教职工来源情况库、工作简历情况库等22个子库组成，这些情况库是反映每位教职工的各方面情况的档案库。这些库中有些情况是不会变化的，如：出生年月、性别、民族、出生地等；有些情况变化频率不高，如部门、室科组、来源情况，婚姻状况等；有些情况变化频率较高，如教学工作情况、奖惩情况、发表论著情况等。如果对所有的情况一并对待不利于数据挖掘。本文并未对上述教职工信息库进行直接挖掘，而是以它作为基础信息来处理的，通过对整个院系（或学科）的教职工的个人信息进行加工处理、运用统计方法对每一个学科的院系（或学科）分别进行聚合、挖掘目的是：找出影响学科发展的因素及各因素间的关联关系。　　　　3 用关联规则发现技术对人事信息库进行挖掘　　　　关联规则技术是数据挖掘领域的一个重要方法，其方法和算法近几年研究较多。所谓关联规则就是描述数据库中数据项（属性，变量）之间所存在的（潜在）关系的规则。根据人事工作战线上的老同志的经验，在人事管理中，发现一些平时并不能引起注意的因系（或规则），具有十分重要的意义。设一个项目的集合I为数据库D中所有的120个项目的集合，每一个记录中的项都是按字典顺序存储的。数据库D中的一个记录T（即T含40个项），T I，T与一个唯一标识符Tid相联系（即记录的形式是）。　　关联规则发现算法的主要问题是通过怎样的算法找出所有强项集(large item sets)，然后找出有效关联规则。所以挖掘所有有效关联规则的问题可分为两个子问题：① 寻找所有的支持度大于最小支持度的项集，即寻找所有的强项集；②用这些强项集去产生想法的规则。第二个问题相对容易解决。　　　　4 算法讨论　　　　Agrawal等人几年前提出了关联规则的发现算法AIS和SETM，1994年又提出了改进算法Apfiofi和ApnofiTid。AIS和SETM算法都是在将记录数据读人数据库的过程中迅速生成候选数据项集。在读人新的记录数据后，就要决定前次过程中的强的数据项集中的哪些应该和这些读入的记录数据中的数据组合，以产生新的候选数据项集。这种方法的缺点是导致许多不必要的数据项集的生成和计数。而Apriori和AprioriTid算法只利用前次过程中生成的强的数据项集来生成新的候选数据项集，因此具有k个数据项的候选数据项集可以通过对具有k-1个数据项的强数据项集组合而生成，删除了那些包含任一k-1子项集不强的数据项集。所产生的候选数据项集要小得多，提高了算法的效率。　　文献给出了多层关联规