“數据压缩”技术助力SAP系统大数据快速输出.docx

“數据压缩”技术助力SAP系统大数据快速输出.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
“數据压缩”技术助力SAP系统大数据快速输出

“数据压缩”技术助力SAP系统大数据快速输出2014-10-14周清湘、韩占峰一、大数据输出困惑ERP系统稳定运行后,随着时间的流逝,系统中业务数据的量级也随之攀升。特别是以SAP、Oracle商务套件为依托的ERP系统,数据增量更为惊人。以笔者所在企业为例:该企业部署了SAP公司的ERP系统,应用涵盖时尚行业、零售行业两大解决方案;其中,零售解决方案的数据增量尤为惊人;如:终端零售数据以平均每年1亿条记录的量级增长,对应的库存事务、财务凭证数据都在1亿条以上。如此海量数据的沉淀,业务用户想快速输出近期明细数据(实时性较强的数据)却成了一种奢望,近期交易数据尚且如此,历史明细数据输出更为艰难。如何满足用户的愿望,实现明细数据的快速输出变得迫在眉睫。好在SAP系统提供了“数据压缩”技术和“信息结构”技术,让明细数据的快速输出成为了现实。笔者与其技术团队运用上述两大核心技术解决了大数据明细输出问题。二、数据实时存储要保证明细数据快速输出,首先要借助“信息结构”技术实现数据的实时存储和简单整合。所谓“信息结构”技术,即:用户根据自身的需要定义数据结构,确定数据整合逻辑及数据汇集粒度;待确定无误后激活该数据结构。一旦被激活,任何与之相关的业务操作都会按照事先设定的业务逻辑要求自动刷新(添加、修改、删除等)对应的数据表(Table)。通过“信息结构”整合后的数据其存储容量大大减少,同时,实现了明细数据的实时存储。与数据仓库比较而言,其特点就在于“实时”又“明细”。三、“数据压缩”技术事实上,“信息结构”中数据记录超过1亿条后,其查询速度也将变慢;这样以来,效率低下的问题依然存在。这时,可使用“簇数据表”技术来解决数据输出速度慢的问题。“簇数据表”以数据块为对象进行存储,其数据表内条目减少50倍左右;而且,其逻辑存储和物理存储完全是一致的,因此,明细数据查询直接定位物理存储,保证数据快速输出。可将“信息结构”中的数据按照一定的逻辑进行分类形成若干个数据块,分类完毕后,“簇数据表”首先存储数据的分类逻辑;而后,将数据块的物理地址与之关联并存储。到此为止,就实现了明细数据的压缩机制。四、“数据解压”过程明细数据需要输出时,一旦用户确定数据的输出条件,程序根据条件内容直接到对应的“簇数据表”中查找符合条件的记录,然后,根据记录中物理地址的指向将数据块释放到内存中。这样以来,就完成了明细数据的快速输出。在实际数据输出时,由于用户所需数据与数据块中的数据不完全一致,同时,也要从多个数据块中获取,为了提高输出效率,可使用“M+N”匹配法从多个数据块中筛选出符合用户需求的明细数据。五、应用案例笔者所在企业的ERP系统中营销数据约4亿条记录,即使通过“信息结构”简单压缩后,数据量仍然在2.5亿左右。当下,在如此海量的数据表中查找近期一个月内的明细数据,依然困难重重。为此,索性引进“数据压缩”技术解决该问题。相关技术部署完毕后,数据输出测试结果:1000万条数据记录可在40秒内输出到显示器上。以下描述重在阐述该技术的应用过程,期待对用户有所启发和帮助。1、“信息结构”配置1.1 定义数据元素(SE11)创建“信息结构”时可以借用ERP系统的字段(Field);由于描述不清晰,故,可自行添加数据元素。1.2 扩展结构MCBEST(SE11)点击“附件结构…”,将新建数据元素加入结构MCBEST中。1.3 维护自定义字段目录(MC18)作用:便于在创建信息结构时字段选择。1.4 维护公式(MC1P)例一:入库数量公式;例二:出库数量公式;例三:入库库金额公式;例四:出库金额公式;1.5 维护自定义“信息结构”(MC21)1.6 维护数据更新规则(MC24)显示其中之一:移动/调整入库数量配置参数; 如何处理:“发票校验”、“修改价格”等无数量更新而有价值更新业务。1.7 激活更新(OMO9)1.8 初始化“信息结构”的数据T-CODE:OLI1用于更新BF事件历史数据;T-CODE:OLIZ用于UM事件历史数据。由发票校验引起的价值更新,既可以通过OLI1更新,也可以通过OLIZ更新;因此,数据初始化时应避免重复,造成数据重复计算。2、“簇数据表”2.1 数据簇概念:数据簇是一个数据块,该数据块聚合了若干ABAP/4中的数据对象(如图所示)。(图1)图1备注1:数据簇 = 数据对象聚合 ,ABAP/4中基本字段,字符串,内表都是数据对象。图1备注2:数据簇可以在ABAP/4内存或数据表进行存取。2.2 “簇数据表”定义:存储数据簇的特殊透明表,称为簇数据表。结构:见图2:(图2)图2中3(关键字)是数据簇的标识,即通过这个标识来找到这个数据簇;它由若干个字段组成,由用户定义。图2中5(用户数据)由用户定义,不是必须字段,可以不定义。图2中7(数据簇)字段名由系

文档评论(0)

fv45ffsjjI + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档