- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据分析分布式MOLAP技术要点
大数据分析分布式MOLAP技术要点
摘要:实际工作中需要使用大数据技术,但是由于其带有规模效应,不利于数据分析、数据管理、数据存储等工作。为了确保工作质量,相关技术人员通过研究和试验,发现使用分布式文件系统优势明显,应用MapReduce编程模型可以解决上述问题。具体而言,使用MOLAP技术之后,利用多维模型进行维度的映射,同时使用线性化算法将测量到的维度等数据存储到分布式文件中。该文对在大数据背景下分布式MOLAP技术要点进行分析,希望给有关人士一些借鉴。
关键词:大数据;分布式;MOLAP技术
中图分类号:TP3 文献标识码:A 文章编号:1009-3044(2018)01-0009-02
Abstract: In practical work, large data technology is needed, but because of its scale effect, it is not conducive to data analysis, data management, data storage and so on. In order to ensure the quality of work, the relevant technical personnel through research and experiment, found that the use of distributed file system has obvious advantages, the application of MapReduce programming model can solve these problems. Specifically, after using MOLAP technology, the multi-dimensional model is used to map the dimensions, and the linear algorithm is used to store the measured dimensions and other data into the distributed file. Below on the background of big data distributed MOLAP technology analysis, hoping to draw some reference for the relevant people.
Key words: Big data; distributed; MOLAP Technology
?τ?MOLAP技术也称之为DOLAP,其使用了多维数据模型,包括维和和事实两个部分,具体操作中必须要找到维和与事实之间的映射关系。DOLAP使用了星象模式,同时使用了关系数据库,将事实数据和维信息都存储到数据库表中。通过外键操作做好对事实数据的映射、维信息的映射等。
1 分析维编码算法和维的遍历算法
1.1 对维编码算法进行深度分析
技术人员都清楚,实际工作中应用OLAP技术进行操作时,需要对维进行频繁的操作,由此可见,实际运行中遍历算法和维编码是非常关键的技术。下面就深入对两种技术进行分析,希望相关人员掌握要领。对于维编码的方法而言,主要包括两种,分别是十进制编码和二进制编码。对于二进制编码而言,内部也将其称之为位图编码,操作中对相关编码进行拼接,进而得到维的级别信息,除此之外,还可以结合编码位移做到对维的遍历,达到最终的技术效果。但是实际使用二进制编码过程中,很容易导致稀疏问题。对于实际运用的十进制编码而言,具体运行操作过程中,系统会对所有级别的维值都使用十进制数进行编码,虽然可以达到相关目的,但是也存在一定的问题,其不能直接得到维值和编码,同时也不能得到相应的映射。在大数据背景下运行,为了有效避免出现稀疏等问题,在DOLAP技术当中进行了处理,其应用十进制进行编码,在此基础上,还开创了一种维的遍历算法,通过这一算法对维值、编码间的映射进行计算。具体而言,设l是维d中的某个维级别,对x∈[1,|md(l)|],vx∈md(l),vx的编码为code(vx),那么就有code(vx)=x1.[1],具体的算法如下:
维编码算法.Input: Dimension d: A target dimension;
Function: DimensionCoding.
1. FOR i=1 TO |L(d)|;
2. FOR j=0 TO |md(li)|?1;
3. Dimension value of vi,j∈md(li)
4. Vi
5.
原创力文档


文档评论(0)