- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
档案用户数据分析引擎建设的研究
档案用户数据分析引擎建设的研究
摘 要:本文提出了一个档案用户数据分析引擎的总体框架模型。在此基础上,探讨了实现与部署该模型应进行的主要工作。集中对档案用户数据分析引擎的实现技术选择以及典型功能的实现方案进行了论述,并对档案用户数据分析引擎的优化问题及其配套制度建设进行了探讨。
关键词:档案用户;分析引擎;协同过滤;档案模型;推荐系统
本文从分析用户数据来提升档案服务的目的出发,立足于档案馆实践需求和实际数据建设能力,提出一个档案用户数据分析引擎架构模型方案。该方案的核心思想是,通过建立档案馆对用户数据的分析机制,指导和促进自身服务的提升。
1 档案用户数据分析引擎模型
本文所称的档案用户数据,是指用户在利用档案过程中所形成的反映档案利用行为、利用主体及客体特征的数据。要实现通过关注档案用户数据促进档案服务的提升,就要建立对这部分数据进行分析、知识抽取以及采取相应行动的机制,这就是档案用户数据分析引擎。该分析引擎的意义在于,使得档案部门可以利用对用户行为数据分析的技术手段,将原本的“数据废气”[1]变废为宝,为档案部门的服务提升和管理进步提供了现实支持。
为此,我们提出一个档案用户数据分析引擎模型,如图1所示:
图1 档案用户数据分析引擎模型
该引擎总体上分为五个层次:存储层、知识提取层、知识表示层、行为层和反馈层。其中存储层主要负责实施对档案用户数据收集、存储和向上层调用控制。该层次中的档案用户数据收集模块负责对档案用户特征、档案利用行为、用户对档案评价等数据的收集,数据整理清洗模块负责规整收集到的数据、消除数据噪声等。随后将收集到的数据存储至档案用户数据库中。隐私保护和密级保护规则模块,负责防止数据向上层调用时违反隐私和保密规则。
存储层之上是知识提取层,其根据收集存储的用户利用数据,运用数据挖掘工具提取出有用知识。主要包括以下的几个功能单元:1.分类模型。对档案用户和所利用档案数据资源进行分类和聚类,按照用户以及利用档案资源之间的相似度判定其各自的所属类别,对用户评价的原因进行分类。2.推荐引擎。主要根据档案用户的利用行为、身份属性或档案资源所获得的评价,为用户推荐档案数据资源,提供档案数据个性化推荐的系统服务。3.评价分析。对档案数据资源所获得的评价进行整理和统计分析,得出用户对所利用的档案资源、服务情况等方面的信息。4.关联分析。对档案用户数据中所体现的规律和联系进行分析,如用户利用目的与利用档案类型的关系,档案数据信息之间在利用中的联系,档案利用行为与特定时间之间的关系,等等。5.异常检测。识别档案用户数据中不常见的、反常的实例,包括异常的评价、利用行为、用户属性信息等,提供给分析引擎的上层进行鉴别与决策,判定这是新的档案利用趋势,还是需要特殊服务的用户,或是对档案利用数据的恶意干扰等。
知识提取层之上是知识表示层,其将知识提取层所抽取的知识,表达成为对于档案服务提升、支持决策有用的、可理解的知识形态。主要包括:1.用户特征表征。例如,对用户的身份特征、利用目的等进行分析和展现,表征档案用户可以分为哪些类型、用户身份特征的变化情况等。2.档案利用特征呈现。这一部分主要展现档案数据资源获得利用的情况、档案资源所获得的评价信息、用户属性与档案利用项目和种类的关系等。3.趋势变动及预估。主要表现随时间变动的档案资源所获评价、用户利用档案以及评价档案的时间特点、对用户未来档案利用行为的预计,等等。
知识表示层之上是行为层,是根据分析引擎所表示的知识规则,提示档案馆应采取策略的功能层次。主要包括:1.服务提升。主要可包括:档案资源个性化推荐、档案数据智能检索、档案用户间交流群建设及相应好友推荐等内容。2.资源建设。根据分析引擎提供的知识来改进档案数据资源的收集与构成,如进行以下工作:档案资源评价分类、用户差评分析、档案数据资源利用关联分析、用户未能检索到的档案资源分析等。3.支持决策。应用分析引擎提取的知识支持档案馆的管理决策,实现循数管理[2]的思想。如通过对档案用户进行分类与聚类、实现小众化服务;通过对档案用户数据中异常实例的感知和分析,确定档案馆应采取的相应措施;通过档案项目所获评价的趋势分析,实施档案开放以及利用工作的前瞻性安排等。
用户满意度是对分析引擎效能的最终极评价指标,用户的反馈意见是引擎优化的根本依据。因此本引擎在设计上设置了反馈层,用以收集档案用户对于引擎驱动的档案服务提升的满意度信息,根据用户实际满意度来调整和完善分析引擎的架构与技术方案。
2 档案用户数据分析引擎的实施与部署
以上我们所提出的分析引擎,从概念模型的角度阐释了引擎总体架构和所包含的功能。下面,我们结合当前档案馆的实际,探讨一下对该引擎进行实
您可能关注的文档
最近下载
- 2025《高质量数据集 质量评测规范》.pdf VIP
- DLT 5210.1-2021 电力建设施工质量验收规程全套表格最新.docx
- 生态环境执法大练兵比武竞赛理论备赛试题库(浓缩500题).docx VIP
- 邮轮上的客舱服务天津海运职业刘艳课件.pptx
- 基于战略视角的上市公司财务报表分析.pptx VIP
- 06SG517-1 轻型屋面三角形钢屋架(圆钢管、方钢管)建筑工程 图集 .docx VIP
- 53. 运动中的音乐选择.docx VIP
- 第7课 走近我们的老师 第2课时(教学课件)2025统编版道德与法治三年级上册.ppt
- 中国工会十八大报告学习问答100题(含答案).docx VIP
- 2024年党纪学习教育应知应会100题题库(含答案).docx VIP
文档评论(0)