大数据时代下的档案信息服务探索.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代下的档案信息服务探索   摘 要:大数据背景下,档案馆的服务模式与应用将会发生改变。首先介绍大数据时代档案馆所面临的时代背景;接着分析大数据背景下档案服务的问题与挑战,最后提出相应的应对途径与方法,以期为开展大数据档案服务提供借鉴和参考。   关键词:大数据 档案服务;数据挖掘   1 大数据与档案服务应用   大数据是一场革命,将改变我们的生活、工作和思维方式。大数据并无统一定义,一般认为由巨量的结构与非结构化数据组成。通常以“4V”特征或称为维度对大数据进行描述性解释:规模(Volume)指数据的数量规模巨大;类型(Variety)指数据类型多样复杂,混合结构化与非结构化的多种类型;实时(Velocity)一方面是数据增长速度快,另一方面是要求在合理的时间内访问、处理数据;价值(Value)反映了数据中隐含着价值转化。大数据发展的最终目标是挖掘数据的应用价值,其重点在于数据的分析和服务应用,“大”不过是信息技术不断发展所产生的海量数据的表象而已。   随着数字档案馆的兴起,档案网络服务得到应用与普及,数字化档案、档案数据库的种类、数量不断攀升,成为档案资源数据的重要增长点,已经达到海量数据规模。另外,档案数据中存在大量的非结构化数据,包括各类照片档案、录音档案、录像档案、文书文档、电子表格等,以数字形式作为文件或录入数据库存储,符合当前大数据的“4V”基本特征。然而,这些档案数据资源远未得到有效与相应的服务利用程度。随着大数据技术的发展与应用,必然需要档案馆进一步从大量的档案信息中分析和挖掘数据的价值,要求档案馆在服务模式、资源利用方式等方面作出相应调整与改变。因此,探索大数据对档案馆服务应用产生的影响以及应用大数据思维方法拓展档案服务是亟须思考和解决的问题。   2 大数据档案服务应用的需求与挑战   大数据背景下,档案数据类型多样、数量众多,档案数据存储分析处理技术、环境与条件的变化导致了其服务应用面临着新的需求与挑战,体现在以下几个方面:   (一)档案数据存储与备份受到挑战 档案数据量已经可达到相当级别的数据规模,并且数据量在不断增长,这就对数据存储系统的扩展能力要求不断提高。档案馆的数据存储已不止于结构化的二维信息,各类图像、音频、视频、网页等非结构化数据来源与数量也在不断增加,会出现类似传统档案管理时的“胀库”问题。同时,必须解决大规模档案数据的安全备份问题,而且在实践中通常会伴随存储管理复杂、存储利用率低下、存储能源消耗巨大等问题。这就必须应用合理可行的集群存储方案,优化存储提高效率和节约成本,运用高效存储技术,比如数据压缩、自动精简配置、自动分层存储、存储虚拟化等解决或缓解这些难题。   (二)档案数据加工分析能力亟待加强 档案建设惯用“仓储”方式,工作重心是征集接收保管档案。近些年虽然也强调档案的数字化工作,但加工与分析处理档案资源的能力严重不足,大量的档案资源的价值得不到有效体现利用。随着信息化进程不断推进,相对大众网站与其他信息机构,拥有海量社会价值信息的档案馆地位作用正在被不断弱化与边缘化。大数据的目标在于数据价值的发现,迫切需要利用数据挖掘、机器学习技术与工具从档案数据中获取有价值的档案知识。通过数据的整合共享,交叉复用提升档案馆的智力资源和知识处理加工能力。   (三)档案服务方式与内容发生变化 传统的信息服务模式和内容虽然能够满足用户的基本要求,但在大数据时代下关注个体的服务需求明显。信息服务的方式和内容以为用户提供个性化、精准化知识服务为目的,强调用户体验与知识发现。用户在面对海量的档案资源时,如何准确快捷地检索利用档案,需要档案馆为用户提供综合一站式的服务体系,良好的用户体验,并且具备个性化服务、语义化服务、社交网络以及数据可视化等服务应用能力。   (四)档案数据隐私安全需求不断增长 数据开放已成为档案馆发展的必然选择,但档案数据中存在各种敏感信息与隐私信息,比如健康档案、医疗档案,开发和利用会涉及到档案信息的安全问题。如何协调处理数据隐私与数据开放之间的矛盾,在开发利用档案的同时保护隐私敏感数据就显得格外重要,必然要在传统的用户准入控制、权限验证等安全技术的基础上,利用安全多方计算、数据模糊、数据加密检索等隐私保护技术提高数据的安全性与可控性。同时,通过制定完善档案安全管理法规制度,明确档案的使用权限,控制和应对未来的潜在风险,健全人防、物防、技防三位一体的档案数据安全防范体系,以防止失泄密问题发生。   3 开展档案大数据服务应用的途径方法   (一)转变观念,拓展服务理念 大数据背景下,促进信息的开放、交流与共享是开展深度信息服务的大势所趋。如果档案馆仍然故步自封、无所作为,不突破传统服务理念与服务范围的局限,那么档案馆会失去大数据发展机遇,作

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档