- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘论文【11篇】
关键词:档案信息管理系统;计算机;数据挖掘技术;1数据挖掘技术概述
数据挖掘技术就是指在大量随机数据中提取隐含信息,并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术,则需要将其划分在商业数据处理技术中,整合商业数据提取和转化机制,并且建构更加系统化的分析模型和处理机制,从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库,满足集成性、时变性以及非易失性等需求,整和数据处理和冗余参数,确保技术框架结构的完整性。
目前,数据挖掘技术常用的工具,如SAS企业的EnterpriseMiner、IBM企业的IntellientMiner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中,往往会利用数据源和数据预处理工具进行数据定型和更新管理,并且应用聚类分析模块、决策树分析模块以及关联分析算法等,借助数据挖掘技术对相关数据进行处理。
2档案信息管理系统计算机数据仓库的建立
客户需求单元
为了充分发挥档案信息管理系统的优势,要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中,要适应迭代式处理特征,并且从用户需求出发整合数据模型,保证其建立过程能按照整体规划有序进行,且能按照目标和分析框架参数完成操作。首先,要确立基础性的数据仓库对象,由于是档案信息管理,因此,要集中划分档案数据分析的主题,并且有效录入档案信息,确保满足档案的数据分析需求。其次,要对日常工作中的用户数据进行集中的挖掘处理,从根本上提高数据仓库分析的完整性。
(1)确定数据仓库的基础性用户,其中,主要包括档案工作人员和使用人员,结合不同人员的工作需求建立相应的数据仓库。
(2)档案工作要利用数据分析和档案用户特征分析进行分类描述。
(3)确定档案的基础性分类主题,一般而言,要将文书档案归档情况、卷数等基础性信息作为分类依据。
数据库设计单元
在设计过程中,要针对不同维度建立相应的参数体系和组成结构,并且有效整合组成事实表的主键项目,建立框架结构。
第一,建立事实表。事实表是数据模型的核心单元,主要是记录相关业务和统计数据的表,能整合数据仓库中的信息单元,并且提升多维空间处理效果,确保数据储存过程切实有效。(1)档案管理中文书档案目录卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档年份,字段类型Int,字段为Gdyearkey;文书归档类型,字段类型Int,字段为Ajtmkey;文书归档单位,字段类型Int,字段为Gddwkey;文书档案生成年份,字段类型Int,字段为Ajscsjkey,以及文书档案包括的文件数目。(2)档案管理中文书档案卷数事实表:事实表主键,字段类型Int,字段为Id;文书归档利用日期,字段类型Int,字段为Datekey;文书归档利用单位,字段类型Int,字段为Dwkey;文书归档利用类别,字段类型Int,字段为Dalbkey;文书归档利用年份,字段类型Int,字段为Dayearkey等[1]。
第二,建立维度表,在实际数据仓库建立和运维工作中,提高数据管理效果和水平,确保建立循环和反馈的系统框架体系,并且处理增长过程和完善过程,有效实现数据库模型设计以及相关维护操作。首先,要对模式的基础性维度进行分析并且制作相应的表,主要包括档案年度维表、利用方式维表等。其次,要建构数据库星型模型体系。最后,要集中判定数据库工具,保证数据库平台在客户管理工作方面具备一定的优势,集中制订商务智能解决方案,保证集成环境的稳定性和数据仓库建模的效果,真正提高数据抽取以及转换工作的实际水平。需要注意的是,在全面整合和分析处理数据的过程中,要分离文书档案中的数据,相关操作如下:
fromdaggdtemp//删除临时表中的数据
Chcount=dag(wswj)//将文书目录中数据导出到数据窗口
Dag1.()//将数据窗口中的数据保存到临时表
相关技术人员要对数据进行有效处理,以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行,从根本上维护数据处理效果。
多维数据模型建立单元
在档案多维数据模型建立的过程中,相关技术人员要判定联机分析处理项目和数据挖掘方案,整合信息系统中的数据源、数据视图、维度参数以及属性参数等,保证具体单元能发挥其实际作用,并且真正发挥档案维表的稳定性、安全性优势。
第一,档案事实表中的数据稳定,事实表是加载和处理档案数据的基本模块,
文档评论(0)