Clemintine中神经网络挖掘应用实验指导书.docxVIP

Clemintine中神经网络挖掘应用实验指导书.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【实验名称】 神经网络在数据挖掘中的应用 【实验目的】 1、认识神经网络的根本组成以及它们的属性和功能。 2、描述神经网络通常执行的学习任务,如模式关联、模式识别、估计、控制以及过滤 3、认识神经网络的根本流程。 4、经过案例把握神经网络操作技术。 【实验内容】 (一)、读入数据 (二)、计算促销前后销售额的变化率 (三)、为数据设置字段格式 (四)、神经网络学习经过 (五)、为训练网络建立评估模型1、将模型结果结点连接到数据流 2、添加字段比较猜测值与实际值 3、评价模型 (六)模型猜测1、猜测模型建立 2、输出规范化 3、选择促销方案 【实验步骤】 示例 goodlearn.str 经过对促销前后商品销售收入的比较,推断促销手段是否对增加商品 收益有关。Clementine 提供了多种猜测模型,包括 Nerual Net、Regression 和 Logistic。这 里我们用神经网络结点建模,评价该模型的优良以及对新的促销方案进行评估。 (一)读入数据 本示例的数据文件保存为 GOODS1n,我们向数据流程区添加 Var. File 结点,并将数据 文件读入该结点。 (二)计算促销前后销售额的变化率 向数据流增加一个 Derive 结点,将该结点命名为 Increase。在公式栏中输入(After - Before) / Before * 100.0 以此来计算促销前后销售额的变化。 (三)为数据设置字段格式 添加一个 Type 结点到数据流中。由于在制定促销方案前我们并不知道促销后商品的销 售额,所以将字段 After 的 Direction 属性设置为 None;神经网络模型需要一个输出,这里 我们将 Increase 字段的 Direction 设置为 Out,除此之外的其它结点全设置为 In。 (四)神经网络学习经过 在设置好各个字段的 Direction 方向后我们将 Neural Net 结点连接入数据 流。 在对 Neural Net 进行设置时我们选择快速建模方式(Quick),选中 Prevent overtraining 防止过度训练。同时我们还能够依据自己的需要设置训练停止的条件。 在建立好神经网络学习模型后我们运行这条数据流,结果将在管理器的Models 栏中显 示。选择查看该结果结点,我们能够对生成的神经网络各个方面的属性有所认识。 (五)为训练网络建立评估模型 1.将模型结果结点连接到数据流 将 Increase 结果结点连接在数据流中的 Type 结点后; 添加字段比较猜测值与实际值 向数据流中增加 Derive 结点并将它命名为 ratio,然后将它连接到Increase 结果结点。 设置该结点属性,将增添的字段的值设置为(abs(Increase - $N-Increase) /Increase) * 100,其 中$N-Increase 是由神经网络生成的猜测结果。经过该字段值的显示我们能够看出猜测值与 实际值之间的差异大小。 评价模型 能够经过观察猜测值与实际值之间的差异来评价模型的优劣。从 Graph 栏中选择 histogram 结点连接到 ratio 结点。 设置该结点,使其输出显示 ratio 的值(在 field 的下拉列表中选择ratio),输出结果如 下图所示: 该图形的横坐标为 ratio 的值,纵坐标表示一共有多少个样本的 ratio 值落在相对应的横 坐标上。从 ratio 的定义公式我们知道 ratio 越小表明猜测值与实际值的差别越 小,所以我们希望更多的 ratio 值处于一个比较小的范围。因此由输出图形我们能够看出该模型达到了一 定的精度。 (六)模型猜测1.猜测模型建立 该模型的建立就是为了猜测新样本。我们现将数据源的文件改为 GOODS2n; 然后按住 alt 键双击 Increase 结点以此来绕过该结点;断开 Increase 结果结点与 Ratio 结点之间的连接,再增添一个 Table 结点观察 Increase 结果结点的输出。在 Type 结点中我们只设置字段 after 的 Direction 属性为 None,其余的都为 In。经过这种方式建立好的数据流如下图所示: 右键单击 Table 结点,选择运行数据流。运行生成的结果如下,其中$N- Increase 为猜测 结果: 输出规范化 $N-Increase 栏表示促销后销售额可能增减的比率。由于神经网络的最后输出需要规范到[0,1]区间,所以我们选择输出值在(0,1)内连续的 S 形函数将结果 规范化。S 型函数表达式 为 f (x) 1 。我们经过增加 Derive 结点将结果其规范化。1 e x 选择促销方案 依据神经网络模型的猜测输出,我们能够选出 GOODS2n 文件中包含

文档评论(0)

182****8569 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6243214025000042
认证主体宁阳诺言网络科技服务中心(个体工商户)
IP属地山东
统一社会信用代码/组织机构代码
92370921MADC8M46XC

1亿VIP精品文档

相关文档