超市商品摆放位置数据挖掘.docxVIP

  • 54
  • 0
  • 约9.82千字
  • 约 16页
  • 2020-12-24 发布于天津
  • 举报
滨江学院 数据挖掘实验报告 题 目: 超市商品摆放位置挖掘报告 院 系: 计算机系 专 业: 软件工程 班 级: 软件1班 小组成员: 刘鹏黄杰飞 吴思维 王悦陆青凤 学 号: 20102344013 20102344009 20102344024 20102344021 20102344014 指导教师: 周北平 日期:2013年6月16日 一、引言 随着计算机技术的应用和普及,各行业中数据的采集、存储能力大大增强,而对数据的处 理和分析能力相对不足。传统的数据库方法虽然可以高效地实现数据的录入、修改、统计和查 询功能,但却无法发现数据中隐藏的信息,人们今天所能获取和存储的数据已远远超过了对其 处理和分析能力,这就造成了所谓的“数据坟墓” ,大量的数据被采集和存储后,闲置下来,无 人问津。数据总量的不断增加,迫切需要有效的分析工具,它能自动、智能和快速地发现大量 数据间隐藏的依赖关系并从大量数据中抽取有用的信息或知识。以人工智能、统计学等为基础 的数据挖掘技术就是为了迎合这种需要而出现的,为现代信息处理提供了一种新的方法和研究 领域。 在展开本文立论前, 有必要对本文研究范围内的核心方面 (数据挖掘的研究动态与发展趋势 ) 作出说明,以便综合与分析。 数据挖掘(DataMining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据库中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知 识的过程。 当前,数据挖掘知识发现的研究方兴未艾,数据挖掘研究人员、系统合应用开发人员所面 临的主要问题是高效而有效的数据挖掘方法和系统的开发, 交互和集成的数据挖掘环境的建立, 以及如何应用挖掘技术解决大型应用问题。研究的焦点可能会聚集在以下几方面 : (1) 数据挖掘语言的形式化描述 :研究专门用于知识发现的数据挖掘语言,以期形式化和 标准化; (2) 可视化数据挖掘:是从大量数据中发现知识的有效途径,使得数据挖掘过程可以被用 户理解,方便进行人机交互; (3) 多媒体数据挖掘:是指从大量的文本数据、图形数据、视频图像数据、音频数据乃至 综合多媒体数据的开采中,通过分析语义和视听特征,发现其中隐含的、有价值的模式,处理 的对象是非结构化的数据,有别于传统的数据挖掘对象; (4) Web数据挖掘:主要是利用数据挖掘技术从 Intranet/lnternet 中自动发现并提取有用 信息的过程,其数据最大特点在于半结构化。因此 Web数据挖掘重点集中在开发新的 Web挖掘 技术以及对Web文档进行预测处理以得到关于文档的特征表示; (5) 数据挖掘中的隐私与信息安全 :是指需要进一步开发有关方法,以便在适当的信息访 问和数据挖掘中确保隐私保护与安全。 二、设计正文 本文工作内容 本文的目标是运用数据挖掘的理论和方法,通过研究分析数据仓库,建立一个与 ERP集成 的以销售为核心的超市决策支持系统,以提高企业商业决策能力。 本文的研究重点有以下几个方面: (1) 对数据挖掘的研究现状进行了分析,探讨了数据挖掘的基本原理与体系结构,并对数 据仓库进行了研究,使得建立超市决策支持系统成为可能; (2) 以超市数据仓库中的数据为原始数据,运用维度建模的方法建立了系统的信息模型, 并且对数据进行分析; (3) 建立超市决策支持原型系统,并在此系统的基础上,对原型系统进行了实例数据挖掘 应用,并把结果进行了可视化转化,最后向企业决策人员提交了挖掘结果。 数据挖掘的概况 2.1数据挖掘的概念 数据挖掘主要是从大量的、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识。这 些知识是隐含的、事先未知的、潜在有用的信息,提取的知识表现为概念、规则、规律、模式 等形式。 数据挖掘是知识发现的重要技术,它并不是用规范的数据库查询语言 (如:SQL语言)进行查 询,而是对查询的内容进行模式的总结和内在规律的搜索。传统的查询和报表处理只是得到事 件发生的结果,并没有深入研究发生的原因,而数据挖掘则主要了解发生的原因,并且以一定 的置信度对未来进行预测,用来为决策行为提供有利的支持。 2.2数据挖掘的任务 数据挖掘的任务是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,并从 中提取辅助决策的关键性数据。数据挖掘的任务主要有以下几方面: (1) 自动预测趋势和行为:自动寻找预测性信息,直接由数据本身得出结论。 (2) 聚类分析。按相似性归纳分类,同类数据彼此相似,不同类数据相异。 (3) 关联分析。目的是找出数据库中隐藏的关联,以支持度和可信度来度量。 (4) 分类。用于规则描述和预测。 时序模式。通过时间序列搜索出的重复发生概率较高的模式。 偏差分析。寻找观察结果与参照之间的差别。 2.3数据挖掘的基本原理 在利用数据挖掘技术进行决策分析

文档评论(0)

1亿VIP精品文档

相关文档