葫芦岛宏运商厦销售数据的序列模式研究.pdf

葫芦岛宏运商厦销售数据的序列模式研究.pdf

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
葫芦岛市宏运商厦销售数据的序列模式研究 1 2 2 刘洲 ,邵良杉 ,李玲 1 辽宁工程术大学研究生学院,辽宁阜新 (123000) 2 辽宁工程技术大学工商管理学院,辽宁阜新 (123000) E-mail :real52525@ 摘 要:在像葫芦岛市宏运商厦这样的大型零售环境中,序列模式挖掘对于有效的提高业务 管理的服务质量具有重大的意义。现今的条形码技术采集的大量销售数据成为挖掘的基础。 通过对这些数据进行数据挖掘我们可以找到对于商业销售及生产极为有效的一些信息(这些 信息通过具体的模式得到反映) ,从而可以提高销售和生产效率,降低成本,取得最大的商 业效益,这就是对宏运商厦的数据进行挖掘的意义所在。本文对序列模式的概念和作用进行 了探讨,对序列模式中寻找大项集的部分用程序加以实现,并对此模式的实现过程用程序流 程的方式加以说明,讨论了几种不同的实现算法。 关键词:数据模式;大项集;算法 中图分类号:TP 1.背景概述 随着宏运商厦数据库管理系统的引入以及条形码技术的应用,积累的数据越来越多。 激增的数据背后隐藏着许多重要的信息,企业希望能够对其进行更高层次的分析,以便更好 地利用这些数据。商厦目前可以高效地实现数据的录入、查询、统计等功能,但无法发现数 据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏 的知识的手段,导致了人们所说的“数据爆炸但知识贫乏”的现象。 计算机技术的另一领域——人工智能自从 1956 年诞生以来,已经取得了重大进展。经 历了博弈时期、自然语言理解、知识工程等阶段,目前研究热点是机器学习。机器学习就是 用计算机模拟人类学习的一门科学,比较成熟的算法有神经网络、遗传算法等。 用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后知 识,这两者的结合便促成了数据库中的知识发现(KDD :Knowledge Discovery in Databases) 的产生。实际上,数据库中的知识发现是一门交叉性学科,涉及到机器学习、模式识别、统 计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。从数据库 中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等许多方面。 数据挖掘是KDD 最核心的部分,是采用机器学习、统计等方法进行知识学习的阶段。 数据挖掘算法的好坏将直接影响到所发现知识的好坏。目前大多数的研究都集中在数据挖掘 算法和应用上。人们往往不严格区分数据挖掘和数据库中的知识发现,把两者混淆使用。一 般在科研领域中称为 KDD ,而在工程领域则称为数据挖掘,而我们所要研究的序列模式就 来是数据挖掘。 2. 问题陈述 2.1 据挖掘的任务及其六种模式 数据挖掘的任务是从数据中发现模式。模式是一个用语言L 来表示的一个表达式E ,它 可用来描述数据集F 中数据的特性,E 所描述的数据是集合F 的一个子集FE 。E 作为一个 模式要求它比列举数据子集FE 中所有元素的描述方法简单。例如,“如果成绩在81~90 之 间,则成绩优良”可称为一个模式,而“如果成绩为 81、82、83、84、85、86、87、88、89 - 1 - 或90,则成绩优良”就不能称之为一个模式。 在实际应用中,往往根据模式的实际作用细分为以下6 种: 2.1.1 分类模式 分类模式是一个分类函数(分类器),能够把数据集中的数据项映射到某个给定的类上。 分类模式往往表现为一棵分类树,根据数据的值从树根开始搜索,沿着数据满足的分支往上 走,走到树叶就能确定类别。 2.1.2 回归模式 回归模式的函数定义与分类模式相似,它们的差别在于分类模式的预测值是离散的,回 归模式的预测值是连续的。如给出某种动物的特征,可以用分类模式判定这种动物是哺乳动 物还是鸟类;给出某个人的教育情况、

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档