最新ibm公司面试题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ibm公司面试题 1、?Data?Stage?分为几个部分(组件),各部分的功能是什么?? Administrator?–?add/delete?projects,?set?defaults?Manager?–?import?meta?data,?backup?projects?Designer?–?assemble?jobs,?compile,?and?execute?Director?–?execute?jobs,?examine?job?run?logs? 2、?Parallel?job?和sequence?job?的区别? (What?is?difference?between?Parallel?job?and?Sequence?job)? Basic?difference?is?server?job?runs?on?windows?platform?usually?and?parallel?job?runs?on?UNIX?platform.? server?job?runs?on?one?node?whereas?parallel?job?runs?on?more?than?one? 3、?在stage中会有虚线分为哪两种,有什么作用?? 在stage中有两种虚线? 参考(reference?link):以它所连接的文件作参考?拒绝(rejects?link):把不满足条件的输出到另一个文件? 4、?Partition和pipeline的概念?? DataStage中有两种实现并行的方法,一种是分区(partitioning),另一种则是管道(pipeline)。?所谓分区,是指将输入的数据按照某种规则,分成大小尽量相等的多块数据,每块数据都可以由一行节点并行读取,这样就实现了并行。? 有以下几类:Round?robin循环分区??随机(Random)??Same分区??完全分区(Entire)?Auto分区?hash分区?modulus分区?DB2分区? 而所谓管道,则是指一条数据在被一个stage处理完成后,立即被输出到一条管道(pipeline)中,下一个stage也立即读取这条管道中的数据进行操作,再一个stage也是如此,一直到最后一个stage。这种情况下,大致上每个stage都同时处在运行状态。因此这也是一种并行。? 5、?Combine?和transform都有什么?? combine:merge?lookup?join?等??transform?:?transformer??Remove?Duplicates?Stage?等? 6、?DATA?SET?FILE?和SEQUENCE?FILE的区别,SEQUENCE?FILE?如和转换成DATA?SET?? data?set分为两种,一种为.v后缀结束,是虚拟的临时性的数据文件,一种以.ds结束,是永久性的数据。由于data?set是DataStage的底层数据文件格式,处理过程中不需要进行任何的处理。它是二进制格式。如果数据需要落地,尽量使用data?set。用dataset保存数据,对数据的分区信息也会保存起来,因此效率非常高。? Sequential?file:?Read?data?from?or?write?data?one?or?more?flat?files.?The?stage?can?have?a?single?input?link?or?a?single?output?link,?and?a?single?rejects?link.?--用Compress转换? 7、?数据源都可以是以什么结尾的文件?? .txt??.csv??.ds等? 8、?可以用哪些方式导入数据?? sequential?File??ftp-plug?in??database?table?(db2??odbc?Oracle?Enterprise)等? 9、Constraint及Derivation的区别? Constraint通过限定条件使符合条件的数据输出到这个output?link。?Derivation通过定义表达式来转换字段值。? 10、?辅助工具都有什么??? Peek??sort??compare??difference? 11、?Odbc?了解?open?databases?connectivity?设置用户名,密码,DB名,在服务器端 12?、hash文件?? It?have?keys?and?values?,to?find?the?value?through?the?key? 13、transformer?stage的执行顺序:先执行变量处理部分,再执行约束,然后按从上往下顺序执行每一列。---? 14、lookup?stage和join?s

文档评论(0)

一杯淡淡的茶 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档