数据挖掘报告书.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数 据 挖 掘 报 告 书 题 目: 关联规则算法在电影爱好中的应用 院 系: 经济管理学院 专 业: 信息管理与信息系统 班 级: 07304班 小组成员: 王梦宇 李肖楠 黄林橙 沈岁 张舒 2010年6月 〇、SQL Server 2005 Microsoft SQL Server 2005是微软公司在2005年12月推出的一个全面的数据库平台,使用集成的商业智能工具,提供了企业级的数据管理。使用 Business Intelligence Development Studio 在Analysis Services 项目中定义数据源、数据源视图、维度和多维数据集,并可以利用其现有的数据挖掘算法方便简单的对数据进行分析。SQL Server 2005包括算法主要有:决策树,关联规则,神经网络,时序,聚类分析等。 微软公司的数据库产品SQL Server 2005中包含了数据挖掘特性, 可以直接从数据库或者数据仓库中进行数据挖掘操作,实现数据挖掘与数据库以及应用程序的紧密耦合,从而大大提高数据挖掘效率。 Microsoft关联规则算法属于priori关联规则算法家族,该算法适用于挖掘频繁项集的非常流行和有效的算法。在关联算法中有两个步骤:第一个步骤是挖掘频繁项集;第二步是基于频繁项集来生成关联规则。 关联规则算法对算法参数的设置非常敏感。以下是用于Microsoft关联规则算法的一系列参数: 1.Minimum_Support:定义了项要成为频繁项集所必须满足的最小支持度。 2.Maximum_Support:定义了频繁项集的最大支持度阈值。 3.Minimum_Probability:定义了一个关联规则的最小概率。 4.Minimum_Importance:重要性小于它的规则会被过滤掉。 5.Maximum_Itemset_Size:指定项集大小的最大值。 6.Minimum_Itemset_Size:指定项集大小的最小值。 7.Maximum_Itemset_Count:定义项集数目的最大值。 一、引言 当今社会是网络的社会,人们通过上网能做很多事情,比如学习、看新闻、交友等等。当然我们觉得有很多人会和我们一样,无聊的时候上网看看电影电视剧。因此说随着网络的发展,电影事业的也得到了发展。现在电影的种类也越来越丰富,不过不是所有电影都符合大家的口味,有的人喜欢惊悚的,有的人喜欢搞笑的等等。这些我们认为都和人们各自的兴趣爱好有一定的关系,同时我们也觉得也能通过人们喜欢看什么样的电影反应出那个人的兴趣爱好。所以我们小组想通过数据挖掘的关联规则算法对电影(movies)和爱好(hobbies)的关系进行挖掘,并希望通过这次的研究挖掘,对SQL Server 2005和数据挖掘能有进一步的了解。 二、应用背景情况 数据来源:数据库MovieClick 挖掘算法:关联规则算法 三、数据挖掘算法的实施 1、添加数据库:打开SQL Server Management Studio,建立连接,然后右击数据库,点击“附加”,然后添加数据库MovieClick,确定后数据库就添加成功。 2、创建新项目:打开business intelligence development studio,选择“文件”→“新建”命令, 新建一个Analysis Services项目。在“名称”文本框中将新项目命名为Adventure Works,点击“确定”按钮。 3、创建数据源及视图:在解决方案管理器中,右击“数据源”,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向数据库添加连接。系统将打开“连接管理器”对话框,在提供程序下拉列表中选择“本机OLE DB\SQL Native Client”选项,在服务器名下拉列表中选择承载MovieClick在“选择或者输入一个数据库名”下拉列表中选择MovieClick选项,再点击确定。 在创建视图时,在解决方案管理器中,右击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”,系统将打开数据源视图向导。在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建的MovieClick数据源。单击“下一步”,在“选择表和视图”页上选择表movies和hobbies,然后单击右箭头键,单击“下一步”。 在“完成向导”页上,默认情况下,系统将数据源视图命名为MovieClick。单击完成。系统将打开数据源视图设计器,显示该数据源视图。在数据源视图设计器的数据源视图窗格中,选择Hobbies中的CustomerID列。将该列

文档评论(0)

damoyihao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档