基于增量式更新的序列模式挖掘模型JZX-MINER的设计研究-计算机应用技术专业论文.docxVIP

基于增量式更新的序列模式挖掘模型JZX-MINER的设计研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要〔注〕近年来F随着我们产生和搜集数据的能力不断增强,在许多商业和政府事务中计算机的日益普及、以及在数据收集工具方面的不断进步,我们面临着大量的数据。成百万的数据库已经被用于商业管理、政府管理、科学和工程管理以及其它许多应用领域。数据和数据库的飞速增长迫切要求我们从己经拥有的大量数据中产生有用的知识或信息。因此,数据挖掘作为一种能够满足这种需求的技术?其重要性得到了前所未有的重视。作为数据挖掘技术的一个重要分支一序列模式F主要用于捕获和时间根关的典型行为,即捕获那些重复出现从而可以用于决策的行为量由于有着很强的实用性,吸引了众多研究者的兴趣。数据挖掘的关键在于处理大量数据、管理和维护规则的技术。为此,要着重解决以下两个问题:(1)设计有效的算法,挖掘序列模式;(2)通过有效的手段F更新、维护己发现的序列模式。并且第2个问题与第1个问题的工作一样是非常重要的。现在己经对第2个问题的工作做了大量的研究,提出了一些维护算法,然而这些算法都是在最小支持度不变的假设下来解决序列模式的更新问题。实际上,在序列挖掘过程中F最小支持度需要不断调整,才能从统计意义上挖掘出真正有效的序列模式,达到用户所需的目的。所以当数据库不变时,也同样存在着序列模式的更新问题。本文结合序列模式的研究现状和最新动态?提出了一种增量挖掘功能的高效序列模式挖掘算法IASP算法;IASP算法将每次扫描数据库获得的候选频繁集和它的支持度计数保存在一个数据库中章从而避免当新的支持度计数大于前次支持度计数时扫描数据库,降低了数据库扫描的频率F改变了传统算法当支持度调整时需要每次扫描数据数的弊端。接着F结合集装箱制造企业日常业务的实际情况,研究和设计了数据挖掘模型JZX-MINER。该模型具有以下两个特点:1.建立在数据仓库系统之上。论文介绍了数据仓库的一般理论和开发方法?并对开发数据仓库的建模技术一一信息打包和雪花模型进行了改进和优化F提出了层次实体、类别实体和层表、类表、详细信息表的概念。[注)本论文得到世界集装箱运输班轮公司查询系统项目的支持。2.在构建集装箱制造企业数据仓库的基础上,根据IASP算法设计面向集装箱行业的数据挖掘模型。并且结合实例,运用该数据模型获得集装箱销售趋势和特殊规律的信息。数据挖掘模型以大型集装箱制造企业为行业背景,可应用于不同领域的零售行业。关键词:数据挖掘、序列模式、AprioríAll算法、数据仓库、IASP算法俨?2AbstractAnamountofdatahavebeengeneratedfortherecentyearswiththeincreasingcapacityingatheringdata,thepopularizationofthecomputerinanumberofbusinessesandgovernmentstransactionsandrapiddevelopmentindatacol1ectingtools.Millionsofdatabaseshavebeenusedinbusinessmanagement,governmentadministration,scientificandengineeringdatamanagement,andmanyotherapplicationfields.Underthissituation,itisurgentlydemandedthatatooloratechnologycanbedevetopedtohelpusautomaticallyextracttheusefulknowledgeandinformationfrommyriaddata.Thereby,datamining,assuchakindofthetechnology,isgiven.theunprecedentedattentions.SequentialPattern,animportantsub-branchofdataminingtechnology,isusedtocapturethetypicaJbehaviorsrelatedtothetime事that?S7tom?nethereoccurringregularity.Itoccupiesalotofresearchersduetoitsstrongerpracticafity.丁hekeytodataminingliesinthetechnologyofdealingwithamountsofdata,managingandmaintainingrules.了herefore,wehavetoresolvetwoissuesasfollows:Designinganefficientalgorithmtominesequentia

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档