一种压缩XML数据仓库的存储策略.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种压缩XML数据仓库的存储策略.pdf

计算机科学2002V01.29No-.8(增刊) 一种压缩XML数据仓库的存储策略¨ A for XMLWarehouse StorageStrategyCompressing 王宏志李建中何震瀛 (哈尔滨工业大学计算机科学与工程系 哈尔滨150001) warehousewith AbstractThis a for XML paperdesigns very storagestrategy largecompressing suchas crawledfromWeb.Weclusterthe lotsofidenticalXMLdocuments data,data history at andthen thecentereach isthedocumentwiththeminimalsum XMLfirst get of cluster,as inthesame tO documentsinthesamecluster.Thusthecenter,theotherdocument distantother formsthe isthe cluster,theeditdistancebetweencenterandotherdocument PCG,as logical the of onthe the and modelour model,we physical design strategy storage.Basedlogical storage inthe methodsof thedata model. management XML Keywordswarehouse,Storage,Compressing,Cluster 及来源等;原始结点(Onode):包含所有信息的中心 1.引言 XML文档;变化结点(Dnode):包含△信息的结点。 随着Internet的迅速发展,XML在计算机领 域得到了广泛的应用,海量的XML文档存储中,一 个导致数据冗余的原因是存在着大量的重复数据, Dnode,来表示它们之间的编辑距离。在每一个Cn— 而这种重复常常是不能简单地作为一般的冗余数据 ode中包含一个XML文档的基本信息,这个序列表 去掉的,因为相似经常是部分的,而数据来源的位置 示的是具有相同结构和信息但是不同基本信息的文 信息和连接信息也是需要存在的内容。事实上在 档。 XML数据仓库中这种数据冗余往往更大。 2.1编

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档