关于计算机信息管理技术探讨.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于计算机信息管理技术探讨

关于计算机信息管理技术探讨   【摘 要】随着科学技术的飞速发展,我们赢来了信息化时代,各类数据越来越丰富。如何准确地记录和传递信息,是全面、正确地利用信息,产生社会价值的重要前提。而数据挖掘技术的出现及其飞速发展,为我们组织管理海量信息,挖掘其中的价值提供了可行的路径。数据挖掘技术在计算机信息管理技术中的具体应用广泛,有进一步研究的价值。   【关键词】计算机;信息管理技术;探讨   人类的发展伴随着信息的传递,从原始社会的结绳记事到封建社会的烽火传书,信息的管理和传播贯穿人类文明进程。随着科学技术的飞速发展,我们赢来了信息化时代,信息与物质和能源共同构成了现代社会的三大支柱资源[1]。随着计算机的普及、网络技术的发展和数据库技术的成熟,人们利用信息技术生产和搜集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等行业[2]。各类数据越来越丰富。如何准确地记录和传递信息,是全面、正确地利用信息,产生社会价值的重要前提。而数据挖掘技术的出现及其飞速发展,为我们组织管理海量信息,挖掘其中的价值提供了可行的路径[3]。   1.数据挖掘概念及现状   数据挖掘是一门研究从数据中寻找有价值信息的新兴学科,是从大量、有缺失的随机模糊数据中提取用户感兴趣的信息的一种应用技术。从决策科学的角度来讲,数据挖掘就是在已知的集合数据集合中建立模型以支持决策的过程。数据挖掘的过程就是从大量的数据源的集合C中发现隐含的模型P。将C定义为输入,将P定义为输出,数据挖掘就是一个从输入到输出的条件映射C=P。挖掘的信息不仅是数据库中的数据,还可以是任何形式组织成的集合数据。既可以是结构化的标准数据,也可以是非结构化的网络资源。通过挖掘这些数据,能够进一步了解信息内在的意义。数据挖掘技术是当前计算机信息管理技术研究的热点。   数据挖掘所采用的方法多种多样,既有定量分析方法,也有定量判断的技术。其应用范围广泛,可以被用于信息的管理、组织等。它是一门前沿学科,涉及数学、计算机、人工智能等多个新兴领域。目前该领域的常用技术有人工神经网络、决策树、遗传算法、最近邻技术、规则归纳、可视化等[4]。   2.数据挖掘在计算机信息管理领域的应用   人们对信息的利用要求已经不只满足一般的信息检索和简单获取。而且还要求组织机构中的信息管理服务部门能对内容进行深入分析,从收集到的大量数据中挖掘出隐藏的、内在的、有用的知识或信息,发现数据间的想关性。为生产生活活动提供更深层次的信息服务。下面以档案管理为例介绍数据挖掘技术的具体应用。   20世纪80年代以来,计算机技术的飞速发展为信息管理提供一种全新的技术手段,使机构以前的档案作为一种信息在信息时代展露头脚。在近20年的计算机管理过程中,各个档案部门积累了大量的数字化信息,既有目录索引、原文文献,又有利用记录、查询统计等方面的信息。目前,估计存于档案数据库中的条目多达10亿条,约有1PB的数据。而相信随着后期数字化档案馆建设工作的展开,数字化的档案信息数量将飞速增长,而现有的计算机信息管理系统只能对这些信息进行简单的检索和数据统计常规分析,远远不能满足实际工作需要,使得存储于数据中的信息不能被充分利用,造成了资源的极大浪费。目前来说,数据挖掘技术存在的应用方向有以下几类:   2.1信息资源的优化建设   通过对数据库系统的查询、运行、检索请求进行挖掘分析,统计数据查询、利用情况,为进一步有针对性地补充和丰富高价值的信息资源提供决策支持。同时对用户的使用情况进行关联分析,发现各类数据库间的关联规则,优化信息管理系统的建设和布局。   通过对用户利用数据库的模式进行深入挖掘,了解用户的兴趣动态,并结合具体科研情况及现有馆藏信息,及时发现信息资源的缺漏,满足用户的需要。   通过网页内容的进一步挖掘,可以对互联网上大量的文档集合的内容进行提取、分类、群聚和关联性分析,从而从大量的互联网资源中抽取潜在的有用信息,通过对网站结构和相互关系的挖掘,找到相关专业及研究方向的权威页面,进一步方便用户的信息资源的获取。   实现信息的自动化处理。针对档案馆主要为文本数据的特点,利用文本挖掘技术实现对文本内容的自动摘要、分类。其基本思想是应用统计算法,提取与主题密切相关的语句,挖掘该文档的类别,自动生成摘要信息和主题词,以供查询[5]。   降低数字化成本。例如,系统对单位人事档案进行数据挖掘分析,发现在每一卷几十份的人事档案中用户利用数量最多的是其中的“简历”等少数几份文件。针对这个结果,在安排扫描数字化工作时,可以设计为只扫描每一卷中部分档案,可以大大减轻扫描人员的工作量,而且节省了设备开销。   预测档案之间关联关系。系统通过对用户的使用情况进行挖掘,发现用户在使用“请示”

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档