数据挖掘技术在图书馆远程访问系统中的应用研究.pdf
2015年 11月 吉林师范大学学报 (自然科学版) No.4
第4期 JournalofJilinNormalUniversity(NaturalScienceEdition) NOV.2015
数据挖掘技术在图书馆远程访 问系统 中的应用研究
白文秀 ,孙 慧 ,张桂杰
(1.吉林师范大学 计算机学院,吉林 四平 136000;2.长春师范大学 图书馆,吉林 长春 130032)
摘 要 :图书馆远程访问系统目前已经成为图书馆电子资源访问不可或缺的一种方式,远程访问系统提供服务
的水平直接影响着电子资源的利用率.借助数据挖掘工具 WEKA对远程访问系统中的数据进行预处理、挖掘、
分析,优化远程访问系统,提高远程访问系统的服务水平.
关键词 :图书馆;远程访问;数据挖掘;怀卡托智能分析环境软件
中图分类号:TP311.13 文献标识码 :A 文章编号:1674—3873.(20i5)04-0149-04
0 引言
图书馆管理科学性是影响我国图书馆事业发展的重要因素之一,管理水平的高低很大程度上依赖于
图书馆各项系统的运行.传统的系统管理方式大多依靠经验进行管理,存在诸多问题.本文通过对图书馆重
要成员之一的远程访问系统进行科学管理,对系统庞大数据进行数据挖掘,根据结果进行分析决策、优化系
统资源分配,使远程访问系统能更好的满足用户的使用要求,为馆内资源的有效利用奠定坚实的基础.
1 数据挖掘及数据挖掘工具WEKA介绍
数据挖掘 (datamining)是指从大量的资料或数据中提取出隐藏于其中的有着特殊关联性信息的过
程.数据挖掘技术 目前主要解决4大类问题,分别为分类、聚类、预测和关联.
数据挖掘工具 (WaikatoEnvironmentforKnowledgeAnalysis,缩写WEKA)是 目前比较成熟的数据挖掘
平台,支持分类、聚类、预测、关联4种经典的数据挖掘任务,而且还具有数据预处理、数据过滤、属性选择、
结果可视化等功能.Weka工作平台汇集了当今最前沿的数据挖掘算法及数据预处理工具,用户能够快速
灵活地将现有的数据集进行规范化的数据挖掘.
2 远程访问系统介绍
远程访问系统是一种锯决使用者由于受到 IP的限制而无法访问内部资源的一种解决方案,用户可以
通过账号登录系统,随时随地访问图书馆内的电子资源.一般远程访 问系统分为前台访 问和后台管理两个
部分,其中前台访 问主要提供用户访 问电子资源的人 口,后台管理的主要职责有用户管理、用户组管理、费
用管理、资源管理、访问管理及 日志管理等.
3 远程访问系统数据介绍
远程访问数据库为SQLServer2008R2数据库,本系统表结构比较复杂,一共有22个表,现对数据表
进行介绍,如表 1所示.
用户信息和资源信息作为远程访 问系统中的基础信息,由于用户通过登录系统,对系统内的电子资源
长期进行访问,导致系统管理模块数据急剧增长,数据量较大,而在这些大量的数据中埋藏着许多有用信
息,而这些信息我们无法逐条总结归纳提取,这些潜在的信息就是我们数据挖掘的力量.
收稿 日期 :2015-09-25 基金项 目:吉林省教育厅 “十二五”科学技术研究项 目(吉教科合字[2013]第 207号)
第一作者简介:白文秀(1976-),男,吉林省四平市人,现为吉林师范大学计算机学院讲师,硕士.研究方向:软件工程
· 149 ·
表 l 远程访问系统常用数据表
4 WEKA远程访问系统数据挖掘
使用WEKA进行数据挖掘主要分 3个步骤,如图1所示.
(1)数据预处理,数据预处理包括数据属性的选择,数据特
征选择 以及特征值处理;
(2)数据训练,训练包括挖掘算法选择,参数调整;
(3)分析挖掘结果,验证挖掘结果是否提取有用信息.
4.1 访 问记录信息挖掘
(1)确定挖掘数据源AccessRecord、User、Role三个信息表.
(2)通过 WEKA数据挖掘工具连接 SQIServer2008R2数
据库,在 PreProcess页面中选择 Op
原创力文档

文档评论(0)