DataSetSet,Aggregator总结.docVIP

下载本文档

2
0
约4.14千字
约 8页
2018-06-26 发布于中国
举报
版权申诉

DataSetSet,Aggregator总结.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Data set 阶段 Data Set阶段是一个文件，它允许您从数据集读取数据或将数据写入数据集，该阶段可具有一个输入链接或一个输出链接，可以将它配置成以并行或顺序方式执行 Data Set 阶段：快速路径 InfoSphere DataStage 有许多缺省设置，这表示您能够在作业中轻松包含Data Set阶段。本部分指定了要使Data Set阶段运行所需的最小步骤。InfoSphere DataStage 提供胃多样化的用户界面，且提供了许多快捷方式供您达到特定目标，本部分描述了基本方法，您将在熟悉产品后知道快捷方式的位置。所需的步骤取决于您是使用Data Set阶段读取还是写入数据集。 Data Set 阶段：“高级”选项卡此选项卡允许您指定一下内容执行方式。阶段可以并行方式或顺序方式执行。在并行方式中，数据集的内容由配置文件中指定的可用节点或“高级”选项卡上指定的任何节点约束处理。在顺序方式中，数据集的整个内容由管理器节点处理。组合方式。缺省情况下为“自动”方式，该方式允许InfoSphere DataStage 合并那些处于并行阶段底层的操作程序，以使它们能够在同一进程中运行。保留分区。您可以选择传播、设置或清除。如果选择设置，那么文件读取操作会请求下一阶段按原样保留分区，“传播”采用上一阶段的标志设置。节点池和资源池约束。选择该选项，可将并行执行执行限于网络中指定的一个或多个节点池或资源池，网络允许您从配置文件填充的下拉列表中进行选择节点映射约束。选择该选项可将并行执行限制为已定义的节点。您可以定义节点映射，方法是在文本框中输入节点号，或单击浏览按钮打开可用节点对话框并从该处选择节点。您正在有效定义该阶段的新节点池 Data Set阶段：输入页面 “输入页面”页面用于指定有关Data Set阶段如何将数据写入数据集的详细信息。Data Set阶段只能有一个输入链接 “常规”选项卡用于指定输入链接的可选描述。“属性”选项卡用于指定链接的实际内容的详细信息。“列”选项卡指定数据的列定义。“高级”选项卡用于更改输入链接的缺省缓冲设置。 Data Set阶段：“输入链接属性”选项卡属性选项卡允许您为输入链接指定属性。这些属性表明如何对入站数据执行写操作以及写入哪个数据集，某些属性是必须的，尽管多属性都有缺省设置。无缺省设置的属性显示为警告色（缺省为红色），当您为其提供值后变为黑色。 DataStage Set阶段：“分区”选项卡在“分区”选项中，可指定有关如何在将传入数据写入数据集之前对这些数据进行分区或收集的详细信息。还可以指定在对数据进行操作之前应当对数据进行排序。缺省情况下，此阶段以“自动”方式对数据进行分区，该方式根据当前和先前阶段的执行方式以及配置文件中指定的节点数目来提供最佳分区方法。如果Data Set阶段正在以顺序方式运行，那么它会先使用缺省的“自动”收集方法收集数据，然后将数据写入文件。在“分区”选项卡中，可覆盖此缺省行为。该选项卡的实际操作取决于：将Data Set阶段设置为以并行方式还是顺序方式执行将作业中的前一阶段设置为以并行方还是以顺序方式执行如果将Data Set阶段设置为以并行方式执行，那么可通过从分区类型下拉列表中进行选择来设置分区方法，这将覆盖当前所有分区。如果将Data Set 阶段设置为以顺序方式执行，但前一阶段正在以并行方式执行，那么可以从收集器下拉列表设置收集方法，这将覆盖缺省的“自动”收集方法 Data Set阶段：输出页面 “输出页面”用于指定有关Data Set 阶段如何从数据集中读取数据的详细信息。Data Set 阶段只能有一个输出链接。 “常规”选项卡用于指定输出链接的可选描述。“属性”选项卡用于指定链接的实际内容的详细信息。“列”选项卡指定入站数据的列定义。“高级”选项卡用于更改输出链接的缺省缓冲设置。 Data Set阶段：源类别数据集的控制文件的名称，可浏览查找此文件或输入作业参数。通常，此文件具有后缀.ds Aggregator阶段 Aggregator阶段是一个处理阶段。它可以将来自单个输入链接的数据行归类到各个组中，并对每个组计算总数或其他聚集函数，每个组的总数通过输出链接从该阶段输出。 Aggregator阶段：快速路径 InfoSphere DataStage有许多缺省设置，这表示您能够在作业中轻松包含Aggregator阶段。本部分指定了要使Aggregator阶段运行所需的最少步骤。InfoSphere DataStage提供了多样化的用户界面，且提供了许多快捷方式供您达到目标，本部分描述了基本方法，您将在熟悉产品后知道快捷方式的位置。要使用Aggregator阶段： --在“阶段”页面“属性”选项卡的“分组