- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ibm公司面试题
1、?Data?Stage?分为几个部分(组件),各部分的功能是什么??
Administrator?–?add/delete?projects,?set?defaults?Manager?–?import?meta?data,?backup?projects?Designer?–?assemble?jobs,?compile,?and?execute?Director?–?execute?jobs,?examine?job?run?logs?
2、?Parallel?job?和sequence?job?的区别?
(What?is?difference?between?Parallel?job?and?Sequence?job)?
Basic?difference?is?server?job?runs?on?windows?platform?usually?and?parallel?job?runs?on?UNIX?platform.?
server?job?runs?on?one?node?whereas?parallel?job?runs?on?more?than?one?
3、?在stage中会有虚线分为哪两种,有什么作用??
在stage中有两种虚线?
参考(reference?link):以它所连接的文件作参考?拒绝(rejects?link):把不满足条件的输出到另一个文件?
4、?Partition和pipeline的概念??
DataStage中有两种实现并行的方法,一种是分区(partitioning),另一种则是管道(pipeline)。?所谓分区,是指将输入的数据按照某种规则,分成大小尽量相等的多块数据,每块数据都可以由一行节点并行读取,这样就实现了并行。?
有以下几类:Round?robin循环分区??随机(Random)??Same分区??完全分区(Entire)?Auto分区?hash分区?modulus分区?DB2分区?
而所谓管道,则是指一条数据在被一个stage处理完成后,立即被输出到一条管道(pipeline)中,下一个stage也立即读取这条管道中的数据进行操作,再一个stage也是如此,一直到最后一个stage。这种情况下,大致上每个stage都同时处在运行状态。因此这也是一种并行。?
5、?Combine?和transform都有什么??
combine:merge?lookup?join?等??transform?:?transformer??Remove?Duplicates?Stage?等?
6、?DATA?SET?FILE?和SEQUENCE?FILE的区别,SEQUENCE?FILE?如和转换成DATA?SET??
data?set分为两种,一种为.v后缀结束,是虚拟的临时性的数据文件,一种以.ds结束,是永久性的数据。由于data?set是DataStage的底层数据文件格式,处理过程中不需要进行任何的处理。它是二进制格式。如果数据需要落地,尽量使用data?set。用dataset保存数据,对数据的分区信息也会保存起来,因此效率非常高。?
Sequential?file:?Read?data?from?or?write?data?one?or?more?flat?files.?The?stage?can?have?a?single?input?link?or?a?single?output?link,?and?a?single?rejects?link.?--用Compress转换?
7、?数据源都可以是以什么结尾的文件??
.txt??.csv??.ds等?
8、?可以用哪些方式导入数据??
sequential?File??ftp-plug?in??database?table?(db2??odbc?Oracle?Enterprise)等?
9、Constraint及Derivation的区别?
Constraint通过限定条件使符合条件的数据输出到这个output?link。?Derivation通过定义表达式来转换字段值。?
10、?辅助工具都有什么???
Peek??sort??compare??difference?
11、?Odbc?了解?open?databases?connectivity?设置用户名,密码,DB名,在服务器端
12?、hash文件??
It?have?keys?and?values?,to?find?the?value?through?the?key?
13、transformer?stage的执行顺序:先执行变量处理部分,再执行约束,然后按从上往下顺序执行每一列。---?
14、lookup?stage和join?s
原创力文档


文档评论(0)