- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
开题报告OnceDI中监视系统的设计与实现.docx
OnceDI中监视系统的设计与实现
报告人:吴辉
导师:口十丹高级工程师
2011-1-18
内容提纲
■选题依据及意义
■国内外研究现状
■研究内容与研究方案 ■工作进展与工作计划
I选题根据及意义(1)
■数据集成
□数据集成是将不同来源与格式的数据逻辑上或物理上进行集 成的过程⑴。
■ ETL (Extract, Transform, Load)
□ ETL完成跨数据源的数据抽取,并将数据经过一定的转换, 最终加载到目的端数据源,是数据集成系统的重要组成部分。
选题根据及意义(2)
数据集成中间件OnceDIExtractDI Server分布式体糸结构分布式体糸结构分布式ETL过分布式ETL过从全局了解糸统情况统计分析评估糸统性能、辅助決策 Internet* DI ServerCont? Center了鮮整个ETL过程的调 度执行情况和数据迁移
数据集成中间件OnceDI
Extract
DI Server
分布式体糸结构
分布式体糸结构
分布式ETL过
分布式ETL过
从全局了解糸统情况
统计分析评估糸
统性能、辅助決策
Internet
* DI Server
Cont? Center
了鮮整个ETL过程的调 度执行情况和数据迁移
——
国内外研究现状(1)
■ ETL Monitoring!2]
□ ETL过程相关指标
执行状态、执行时间、抽取速率、加载速率、吞吐率等
“You will want to monitor job status for all job runs initiated by the job scheduler including pending, running, completed, and suspended jobs…”
□系统基础设施性能指标
CPU使用、内存使用、磁盘读写速率、网络传输速率等
□数据统计
“Users often want to know exactly when a table has been loaded or if any rows were rejected...
Mcapturi ng the historical data to support trending performs nee over time. “
Be sure to trigger alerts whenever an ETL job takes significantly more or less time to complete than indicated by the historical record.^^
[2]Ralph Kimball, Joe (^aserta. The Data Warehouse ETL Toolkit, Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data.Wiley, 2004
国内外研究现状(2)
■主流ETL工具的监控功能
□ ETL中间件
Informatica PowerCenter, Talend, IBM DataStage
□数据库附带ETL工具
Microsoft SQL Server Integration Service, Oracle Data Integrator
□不足:统计分析功能简单,大多没有提供监视ETL过 程执行进度的功能。
■其它
□低干扰(Low intrusion)
——可酉F!置
监视糸统的体糸结构
Studio? OnceDI
Studio
? OnceDI 控制
Mon计or Client
>监视信息流
流OnceDI数
据流
Relational l)B
MAgenl
DI Server
Control
Center
AAA齐 rrt
XML
研究内容和研究方法(2)
Client, cfg
监视糸统的体糸结构
MCenter.cfg
Data Cash
Client Interface
Monitor Center
P将
Alarm
I odd I
Agent RegisteJ
Dispatcher
Session
监视信息的收集和传输
监视信息的组织和存储
监视信息的统计、分析和展示
1.监视信息的收集和传输
目的:通过收集各种监视指标来反映糸统 的行为和状态
1.ETL indicatorsMeta datanameauthorETL过程的执行进度二拆干祁 e二二二2.ProgressStart/End timePerformance results writeDuration?T3:
1.
ETL indicators
Meta data
name
a
您可能关注的文档
最近下载
- 中职英语高教版(2023修订版)基础模块2六单元《Craftsmanship》单词讲解课件.pptx VIP
- 工程测量知识-岗培教材编写组-1733413134179.ppt VIP
- 初中历史主题式教学模式的实践与探索.docx VIP
- 监理整改通知单.docx VIP
- 安全管理制度安全管理制度.pdf VIP
- 中职英语高教版(2023修订版)基础模块2六单元《Craftsmanship》课件.pptx VIP
- 大学生心理健康教育.pptx VIP
- 2022年一级建造师《铁路实务》真题及答案.doc VIP
- 2017.48钍基熔盐堆核能系统.pptx VIP
- 专题30 解析几何解答题综合(七大考点,87题)(原卷版)十年(2016-2025)高考数学真题分类汇编.docx
文档评论(0)