多关系关联规则挖掘分析-计算机软件与理论专业论文.docxVIP

多关系关联规则挖掘分析-计算机软件与理论专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多关系关联规则挖掘分析-计算机软件与理论专业论文

独创 性声 明 +人声明所呈交à(J字但论文是工拉人在导师=! 导下进行的吁飞工作 JI 唱得司 明充戎呆.1害我,町 JiI1. 除丁文平·恃别加 l标汪 ;生活的地方卦,论文中 tJ主含;t. 他人已经建录虱撰写过的晋时果·也不包含奇如 J缸13 或其 lR育机构 的学{!tl呈迂 44 而使用江的咛抖.与我 同二L 作的同 zzf车研吃所式的任:可贡敲均 已在 告文中作了明沓的现明并表示:站,飞· 学位论文作者茎名: f1  圣字 2 明:  正ol l.) 正  5月 IK Ei 学位论文版权使用 投权书 草堂也论文咕舌元全 7 爵 亨 }\rl-K关 . j更可芋位诠立的成足 有J飞安革羊同王京可关部门或机构过灭论文均 ·亘古佳 h瑾主,立评论文泣量因如 崎间.本人投民字也 N?可忡幸垃论文为全部或部分#军 司 关故据 进行 陆萃,可 A呆电影申‘结白在扫结 等 :复制三三 民民年 .L喝芋位沱大 .. I 民主均学位论文革摇营后逗,有直接技弓 学位常工作舌茎名:  寸 1 导!I币;生名: 与- ‘._ - 曾号 到均1 010 年 S- 1 3 ,- ,茎丰吕;悔: J_g 1 ,- , 字 位 告文作者半立去 J句: Ii8 唁- _r:I .;;..,.- 工作单 位: 通讯地址: 也语: 却辑: 第一章 第一章 绪论 多关系关联规则挖掘研究 多关系关联规则挖掘研究 PAGE PAGE 13 PAGE PAGE 10 第一章 绪论 在本章中,主要介绍数据挖掘的一些基本概念及其最新的发展,并且分析 讨论了关联规则挖掘算法在星型数据库中存在的问题,阐明了课题研究的背景 和主要内容,给出本文的主要内容和组织结构。 1.1 引言 在计算机技术和互联网技术飞速发展的当今社会,越来越多的企事业单位 开始采用计算机来进行信息化管理运营。企业在信息化管理过程中收集生成了 大量的数据,并且这些数据量与日俱增。众所周知,企业采集的数据是一个企 业经验的积累,当这个积累量达到一个度时,就会反映出一定的规律来。在当 今这个信息爆炸的时代,对企业而言,这些庞大的数据就是一个巨大的宝库。 信息的大小就意味着竞争力的大小,所以人们急切地需要得知堆积如山的数据 中的规律,用这些规律来辅助企业做出技术和经营决策,使其能在竞争中立于 不败之地。人们从来都是依靠经验以及大量的分析计算来处理这些深藏在大量 信息之中的深层信息,并以此为依据做出决策。然而,数据量的大量增长,使 得人们在面对如此庞大的数据根本无法发现其中的隐含规律,或者利用这些数 据来对未来发展走势进行预测。目前对于这样的少量数据直接进行处理分析的 工具非常少,数据库管理系统只能对数据库中存储的数据进行存取、更新、删 除、修改等一些简单的操作,不能协助人们对其中数据进行分析。如何解决这 样的问题成为人们研究的重点。 数据挖掘技术应运而生,成为信息处理的一种新兴技术。数据挖掘技术从 诞生以来得到了迅速的发展,它可以从浩如烟海的原始数据中提取人们感兴趣 的、尚未被发现的、隐含的、有用的信息和知识。它主要是利用 DBMS 来存储 数据,并对数据利用机器学习的方法进行分析,挖掘隐含在数据其中的信息。 在技术上可以根据它的工作过程将其分为:数据的抽取、数据的展现以及 数据的存储和管理等关键技术[1]。 数据进入仓库首先要进行数据的抽取,可以把数据的抽取是一个入口。数 据仓库作为一个独立的数据环境,需要通过一个抽取的过程来将数据从数据存 储介质中导入数据仓库。而这些数据存储介质包括联机事务处理系统、外部数 据源、脱机的数据。所谓抽取,其中包括数据的互连、复制、调度、增量、转 换以及监控等几个方面。 数据展现主要表现方式有[1]:查询、报表、统计、挖掘、可视化。其中查 询包括:预定义查询、动态查询、OLAP 查询与决策智能查询;统计包括:进行 平均值、最大值、最小值、期望、排序等各种统计分析;报表包括:产生关系 数据表格、OLAP 表格、报告以及各种综合报表;可视化包括:用易于理解的点 线图、直方图等图、交互式的可视化、动态模拟或者是利用计算机动画技术来 表现复杂数据及其相互关系;挖掘是指从数据中得到关于数据关系和模式的知 识。 数据的存储和管理是数据仓库的组织管理方式决定了它有别于传统数据库 的特性。随时间的推移,数据仓库中的数据量在快速地累积。如何在数据仓库 的数据存储和管理中解决管理大量的数据、并行处理大量的数据以及如何优化 查询等问题越来越成为研究的重点和热点。目前,已经有许多数据库厂家为此 提供技术和解决方案。他们试图扩展关系型数据库的功能,将普通关系数据库 改造成适合担当数据仓库的服务器。 从现如今进行中的研究情况来看,数据挖掘技术依然存在着

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档