- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验8决策树.
一、准备 Analysis Services 数据库
(一)、创建 Analysis Services 项目
打开 Business Intelligence Development Studio。
在“文件”菜单上,指向“新建”,然后选择“项目”。
确保已选中“模板”窗格中的“Analysis Services 项目”。
在“名称”框中,将新项目命名为 AdventureWorks。
单击“确定”。
(二)、创建数据源
在解决方案资源管理器中,右键单击“数据源”文件夹,然后选择“新建数据源”。
系统将打开数据源向导。
在“欢迎使用数据源向导”页面中,单击“下一步”按钮。
单击“新建”向 Adventure Works 数据库添加连接。
系统将打开“连接管理器”对话框。
在“连接管理器”的“提供程序”列表中,选择默认值。
在“服务器名称”列表中,选择承载 AdventureWorksDW 的服务器。
输入您的凭据。
例如,如果在本地服务器上承载数据库,则选择 localhost。
在“选择或输入数据库名称”列表中,选择 AdventureWorksDW,再单击“确定”按钮。
单击“下一步”按钮进入向导的下一页。
在“模拟信息”页中,选择“使用服务帐户”,再单击“下一步”。
请注意,在“完成向导”页面中,数据源的默认名称为 Adventure Works DW。
单击“完成”。
新的数据源 Adventure Works DW 将显示在解决方案资源管理器的“数据源”文件夹中。
(三)创建数据源视图
在解决方案资源管理器中,右键单击“数据源视图”,选择“新建数据源视图”。
系统将打开数据源视图向导。
在“欢迎使用数据源视图向导”页上,单击“下一步”。
在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的 Adventure Works DW 数据源。单击“下一步”。
若要创建新数据源,请单击“新建数据源”,启动数据源向导。
在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中:
dbo.ProspectiveBuyer
dbo.vAssocSeqLineItems
dbo.vAssocSeqOrders
dbo.vTargetMail
dbo.vTimeSeries
单击“下一步”。
在“完成向导”页上,默认情况下,系统将数据源视图命名为 Adventure Works DW。单击“完成”。
系统将打开数据源视图设计器,显示 Adventure Works DW 数据源视图。
(四)创建新的表格关系
在数据源视图设计器的数据源视图窗格中,选择 vAssocSeqLineItems 表中的 OrderNumber 列。
将该列拖到 vAssocSeqOrders 表中,并将其放到 OrderNumber 列上。
现在,vAssocSeqOrders 和 vAssocSeqLineItems 表之间便存在新的多对一关系。
二、生成决策树方案
Adventure Works Cycle 公司的市场部需要标识其以前客户的特征,这些特征可以指示这些客户以后是否有可能购买其产品。AdventureWorks 数据库存储了描述其以前客户的人口统计信息。通过使用 Microsoft 决策树算法分析这些信息,市场部可以生成一个模型,该模型根据有关特定客户的已知列的状态(如人口统计或以前的购买模式)预测该客户是否会购买产品。
算法的原理Microsoft 决策树通过在树中创建一系列拆分(也称为节点)来生成数据挖掘模型。每当发现输入列与可预测列密切相关时,算法便会向该模型中添加一个节点。该算法确定拆分的方式不同,主要取决于它预测的是连续列还是离散列。通过柱状图可以演示 Microsoft 决策树算法为可预测的离散列生成树的方式。下面的关系图显示了一个根据输入列 Age 绘出可预测列 Bike Buyers 的柱状图。该柱状图显示了客户的年龄可帮助判断该客户是否将会购买自行车。该关系图中显示的关联将会使 Microsoft 决策树算法在模型中创建一个新节点。随着算法不断向模型中添加新节点,便形成了树结构。该树的顶端节点描述了客户总体可预测列的分解。随着模型的不断增大,该算法将考虑所有列。Microsoft 决策树算法支持多个参数,这些参数会对所生成的挖掘模型的性能和准确性产生影响。下表对各参数进行了说明:参数 说明 MAXIMUM_INPUT_ATTRIBUTES 定义算法在调用功能选择之前可以处理的输入属性数。如果将此值设置为 0,则表示关闭功能选择。
默认值为 255。 MAXIMUM_OUTPUT_ATTRIBUTES 定义算法在调用功能选择之前可以处理的输出属性数。如果将此值
文档评论(0)