- 9
- 0
- 约7.85千字
- 约 17页
- 2018-10-17 发布于福建
- 举报
数据精简整合系统范式管理的研究
数据精简整合系统范式管理的研究
[摘 要] 本文针对信息系统中冗余数据主要集中在数据库重复记录的特点,对这部分的冗余数据进行精简。对数据库重复记录分别进行:预处理、表内精简、用SOM-BP网络在异构数据库间建立同类型字段的匹配关系、求取匹配记录对、对共享池进行精简这5个步骤实现共享池数据的精简。建立了高校信息管理系统共享池建设中异构数据库的精简范式。这套精简系统满足了高校信息集成过程中对数据精简的需求,提高了效率。
[关键词] 数据精简;数据整合;共享池
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016 . 01. 098
[中图分类号] G250.76 [文献标识码] A [文章编号] 1673 - 0194(2016)01- 0189- 06
0 引 言
高校数据集成是目前高校信息共享工程中的一个核心的构成,而信息集成前的异构数据含有大量冗余数据,这些冗余数据在数据库中以重复字段的形式存在,重复数据直接影响数据的质量,进而影响到信息决策的准确性和成本的投入量。本文以高校信息系统的数据库属性级、记录级的脏数据为研究对象,展开研究并提出了一套建立数据精简整合系统的范式。
1 相关工作
范式是符合某一种级别的关系模式的集合,在本文中“范式”指的是数据集成过程中对异构数据库中的冗余数据进行精
原创力文档

文档评论(0)