- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华中科技大学硕士学位论文
华
中
科
技
大
学
硕
士
学
位
论
文
II
II
Abstract
With the development of information technology, more and more data are generated. These data, both contain large amounts of structured data, and also contains large amounts of unstructured data and semi-structured data. Data capacity becomes bigger, data growth rate becomes faster, the format of the data becomes more complex, the demand of data processing becomes more urgent, all these bring new challenges to ETL. Design a ETL which can effectively handle big data has important practical significance.
First, according to the characteristics of big data, we puts forward the system functional objectives and performance goals on the basis of the needs analysis. According to the big data processing requirements , we designs a ETL architecture with effective support for big data processing and designs the ETL workflow. In order to optimize ETL workflow, improve the efficiency of data processing, we designs the rules of ETL by classification, merger which is suitable for big data environment. The same time, according to the characteristics of the MapReduce,we give the design of MapReduce workflow and the mapping rules between MapReduce workflow and ETL workflow.
Again, the realization of the system is introduced. Universal data access module implements the data extraction and loading, especially for unstructured data extraction. The workflow module is used to parse the metadata to generate local workflow and MapReduce workflow model. The execution module is used to complete the procedure from data extraction to data loading. Metadata management module realize the storage of metadata.
Finally, the experiment showed that the system realizes the function of big data processing and meets the design goals.Through the use of MapReduce can enhance the ETL data processing efficiency in the certain degree.
Key words:data processing, extraction transformation loading, big data, workflow
PAGE IV
PAGE IV
目 录
摘要I
Abstract II
1
您可能关注的文档
- 黄连阿胶胶囊治疗不寐(阴虚火旺证)临床研究-中医内科学专业毕业论文.docx
- 考虑公平关切的供应链契约分析-运筹学与控制论专业毕业论文.docx
- 脉冲强磁场对新生大鼠神经干细胞β-catenin表达的影响-康复医学与理疗学专业毕业论文.docx
- 面向印刷产业链的A融资租赁公司创新服务模式研究-工商管理专业毕业论文.docx
- 蜜罐网络防御系统的设计与实现-计算机应用技术专业毕业论文.docx
- 面向城市道路交通信息挖掘的Apriori算法研究-控制科学与工程专业毕业论文.docx
- 马克思《1844年经济学哲学手稿》中的对象化思想探究-马克思主义哲学专业毕业论文.docx
- 考虑成本分担的供应链契约协调研究-企业管理专业毕业论文.docx
- 马齿苋、当归复方抗氧化护肤凝胶及护肤霜的研究-药剂学专业毕业论文.docx
- 绝经后女性2型糖尿病患者性激素水平变化的探讨-内科学专业毕业论文.docx
- 煤炭上市公司资本结构优化研究-企业管理专业毕业论文.docx
- 美国HJ公司XX服装品牌中国推广策略研究-工商管理专业毕业论文.docx
- 面向5G的大规模MIMO预编码算法研究-通信与信息系统专业毕业论文.docx
- 煤矿许用毫秒延期电雷管延期精度的实验研究-采矿工程专业毕业论文.docx
- 曼地亚红豆杉枝叶中活性成分的含量测定研究-药物化学专业毕业论文.docx
- 空心莲子草组织培养及干旱和盐诱导基因表达载体构建研究-生物化学与分子生物学专业毕业论文.docx
- 面向产业结构调整的FAW微型车发展战略若干问题研究-企业管理专业毕业论文.docx
- 煤矿工人不安全行为管理实证研究工商管理专业毕业论文.docx
- 旅游外宣广告的修辞叙事批评——以《美在广西》为例-外国语言学及应用语言学专业毕业论文.docx
- 面神经麻痹预后因素的回归分析-针灸推拿学专业毕业论文.docx
最近下载
- 2025年幼儿园校舍安全排查自查报告范文.docx
- (GB6722-2023)爆破安全规程(四).docx VIP
- 人教新起点版六年级英语上册Unit-6-Winter-Vacation-整单元ppt课件.pptx VIP
- 盖梁双抱箍法施工工法.pdf VIP
- 金天钛业-市场前景及投资研究报告-材料强国,高端制造,高端钛合金,航空深海铸就高成长.pdf VIP
- 船舶监造培训课件.ppt VIP
- 第12课 纪念白求恩(提升训练)(教师版).docx VIP
- 职业卫生与职业医学知识点汇总.pdf VIP
- DG_TJ08-202-2020:钻孔灌注桩施工标准.pdf VIP
- 山东省济南一中《中外历史纲要(上)》全册知识点复习课件(.pptx VIP
原创力文档


文档评论(0)