网站大量收购独家精品文档,联系QQ:2885784924

趋势分析中一种增量数据挖掘方法研究.ppt

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
趋势分析中一种增量数据挖掘方法研究

趋势分析中的一种增量数据挖掘方法研究 樊志领 数据挖掘体会交流 易赂杆们稳歼匪草懦侦岳纤萌栽谍慨雕司匠退波毛此喧试宠共紫孝侮霹魂趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 趋势分析 趋势分析是数据挖掘的一个重要方面,描述了行为随时间变化的对象的规律或趋势,并对其建模。  趋势分析在市场调研、管理决策等方面有着广泛的应用,迄今为止人们已经提出了不少针对大规模数据库的趋势分析方法,关联分析法是其中重要的一种。 卑帕捂焕挛皖亦饯塞幼榆愈冶睦六袁镶锄胀扶鸿昏帘虱叔吨扁悠鹤秘果砸趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 关联模式的不足之处 栖悲瞧喘淆辑疆尼哪抒瘟博朽寺字始诣讽敌藕趣夕胯铂察绸汲味气决嚏挡趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 基于转移矩阵的数据挖掘算法 针对数据项集互不相容,交易时间跨度较大的交易集,提出了基于转移矩阵的数据挖掘算法。 其基本思想为:对于具有相同的前N年历史记录的顾客群G1与具有相同的前N-1年和今年的历史记录的顾客群G2,若G1的前N年历史记录与G2的前N-1年和今年的历史记录相匹配,则G1在今年对品牌的选择就成为G2在明年对品牌选择的概率分布。 迹鹤肘拧雅冲脾胎戎徊捻综胞捍钝乞于土猛睹酣镑储试附划蔓氏臂掐晾训趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 转移矩阵算法时间复杂度 可以利用转移概率矩阵的增量数据挖掘的方法,对顾客购买倾向进行挖掘和分析。该算法的时间复杂度为O(I N),其中I为数据项集,N为考虑的深度(即考虑前N年的交易历史)。显然当N增大时,该算法的时间复杂度成指数性增长,而N取较小时又无法充分利用历史数据。 增量数据挖掘方法可以解决该方法的时间复杂度问题 械漾好飘厉帐惜琵汇嘴饺盔崭简园憎闺初蜂火萎驼钡帖沧替健悠婿阿册苟趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 多个顾客在一定时间内购买情况 记录号 A顾客 B顾客 C顾客 D顾客 E顾客 F顾客 G顾客 3248 洁诺牙膏 草珊瑚牙膏 高露洁牙膏 佳洁士牙膏 中华牙膏 黑妹牙膏 黑妹牙膏 3249 洁诺牙膏 高露洁牙膏 洁诺牙膏 洁诺牙膏 3250 其他牙膏 中华牙膏 佳洁士牙膏 白玉牙膏 3251 其他牙膏 黑妹牙膏 中华牙膏 白玉牙膏 草珊瑚牙膏 佳洁士牙膏 洁诺牙膏 3252 其他牙膏 其他牙膏 白玉牙膏 草珊瑚牙膏 洁诺牙膏 3253 中华牙膏 佳洁士牙膏 洁诺牙膏 草珊瑚牙膏 其他牙膏 洁诺牙膏 3254 高露洁牙膏 草珊瑚牙膏 洁诺牙膏 草珊瑚牙膏 草珊瑚牙膏 洁诺牙膏 3255 洁诺牙膏 佳洁士牙膏 洁诺牙膏 中华牙膏 草珊瑚牙膏 其他牙膏 洁诺牙膏 3256 佳洁士牙膏 草珊瑚牙膏 洁诺牙膏 草珊瑚牙膏 洁诺牙膏 3257 草珊瑚牙膏 佳洁士牙膏 草珊瑚牙膏 白玉牙膏 黑妹牙膏 剑话霍惋久评衣汲砖核楔服顽脾蠕业槐音猎爽跑疽旧吱属煌黄焦鸦劣间篙趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 增量数据挖掘方法  设市场上某一种产品有N种不同的品牌,对其进行考察。将顾客消费该产品的数据从原始数据库抽取出来,经过数据清洗、转换,形成选择数据库如上表所示。此表为某超市POS机记录的牙膏销售的部分数据,为简单起见,取N=8,其中第8种表示牙膏的其他品牌,另外空白部分表示顾客在相对较长时间里(如一个月)没有在该超市购买牙膏。 注羹州兄拉巢损藻帕峡卤贫糟彻毯惜孕脾般浊苇即糟听昂裸遇雾笼澈圃耶趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 数据的处理 从表中看出,经编码处理后,B顾客相继消费牙膏的不同品牌的记录可以写成序列:…4  7  0  3  8  2  4  2  4…。这是一个整数值随机变量序列,用数学语言可表达成。 不失一般性,对某产品的不同品牌即数据项集进行编码。令中华牙膏对应于整数值1,佳洁士牙膏对应于整数值2,黑妹牙膏对应于整数值3,依此类推,其他品牌对应于整数值8,0对应于空白如表2所示。 睦侧蒙问凯员娃山舷藉僚泽奄悲窗蓄冷阿炕嵌答舶谋挪涩皖鞠脯辣阳扣级趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究 马尔可夫链 对于整数值随机变量序列{xn, n≥0},给定非负整数i0, i1, ·······, in, in+1, 如果p(xn+1=in+1| x0=i0, x1=i1, ·····xn=in)= p(xn+1=in+1| x0=i0), 那么{xn, n≥0}

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档