- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
趋势分析中一种增量数据挖掘方法研究
趋势分析中的一种增量数据挖掘方法研究
樊志领
数据挖掘体会交流
易赂杆们稳歼匪草懦侦岳纤萌栽谍慨雕司匠退波毛此喧试宠共紫孝侮霹魂趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
趋势分析
趋势分析是数据挖掘的一个重要方面,描述了行为随时间变化的对象的规律或趋势,并对其建模。
趋势分析在市场调研、管理决策等方面有着广泛的应用,迄今为止人们已经提出了不少针对大规模数据库的趋势分析方法,关联分析法是其中重要的一种。
卑帕捂焕挛皖亦饯塞幼榆愈冶睦六袁镶锄胀扶鸿昏帘虱叔吨扁悠鹤秘果砸趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
关联模式的不足之处
栖悲瞧喘淆辑疆尼哪抒瘟博朽寺字始诣讽敌藕趣夕胯铂察绸汲味气决嚏挡趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
基于转移矩阵的数据挖掘算法
针对数据项集互不相容,交易时间跨度较大的交易集,提出了基于转移矩阵的数据挖掘算法。
其基本思想为:对于具有相同的前N年历史记录的顾客群G1与具有相同的前N-1年和今年的历史记录的顾客群G2,若G1的前N年历史记录与G2的前N-1年和今年的历史记录相匹配,则G1在今年对品牌的选择就成为G2在明年对品牌选择的概率分布。
迹鹤肘拧雅冲脾胎戎徊捻综胞捍钝乞于土猛睹酣镑储试附划蔓氏臂掐晾训趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
转移矩阵算法时间复杂度
可以利用转移概率矩阵的增量数据挖掘的方法,对顾客购买倾向进行挖掘和分析。该算法的时间复杂度为O(I N),其中I为数据项集,N为考虑的深度(即考虑前N年的交易历史)。显然当N增大时,该算法的时间复杂度成指数性增长,而N取较小时又无法充分利用历史数据。
增量数据挖掘方法可以解决该方法的时间复杂度问题
械漾好飘厉帐惜琵汇嘴饺盔崭简园憎闺初蜂火萎驼钡帖沧替健悠婿阿册苟趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
多个顾客在一定时间内购买情况
记录号
A顾客
B顾客
C顾客
D顾客
E顾客
F顾客
G顾客
3248
洁诺牙膏
草珊瑚牙膏
高露洁牙膏
佳洁士牙膏
中华牙膏
黑妹牙膏
黑妹牙膏
3249
洁诺牙膏
高露洁牙膏
洁诺牙膏
洁诺牙膏
3250
其他牙膏
中华牙膏
佳洁士牙膏
白玉牙膏
3251
其他牙膏
黑妹牙膏
中华牙膏
白玉牙膏
草珊瑚牙膏
佳洁士牙膏
洁诺牙膏
3252
其他牙膏
其他牙膏
白玉牙膏
草珊瑚牙膏
洁诺牙膏
3253
中华牙膏
佳洁士牙膏
洁诺牙膏
草珊瑚牙膏
其他牙膏
洁诺牙膏
3254
高露洁牙膏
草珊瑚牙膏
洁诺牙膏
草珊瑚牙膏
草珊瑚牙膏
洁诺牙膏
3255
洁诺牙膏
佳洁士牙膏
洁诺牙膏
中华牙膏
草珊瑚牙膏
其他牙膏
洁诺牙膏
3256
佳洁士牙膏
草珊瑚牙膏
洁诺牙膏
草珊瑚牙膏
洁诺牙膏
3257
草珊瑚牙膏
佳洁士牙膏
草珊瑚牙膏
白玉牙膏
黑妹牙膏
剑话霍惋久评衣汲砖核楔服顽脾蠕业槐音猎爽跑疽旧吱属煌黄焦鸦劣间篙趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
增量数据挖掘方法
设市场上某一种产品有N种不同的品牌,对其进行考察。将顾客消费该产品的数据从原始数据库抽取出来,经过数据清洗、转换,形成选择数据库如上表所示。此表为某超市POS机记录的牙膏销售的部分数据,为简单起见,取N=8,其中第8种表示牙膏的其他品牌,另外空白部分表示顾客在相对较长时间里(如一个月)没有在该超市购买牙膏。
注羹州兄拉巢损藻帕峡卤贫糟彻毯惜孕脾般浊苇即糟听昂裸遇雾笼澈圃耶趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
数据的处理
从表中看出,经编码处理后,B顾客相继消费牙膏的不同品牌的记录可以写成序列:…4 7 0 3 8 2 4 2 4…。这是一个整数值随机变量序列,用数学语言可表达成。
不失一般性,对某产品的不同品牌即数据项集进行编码。令中华牙膏对应于整数值1,佳洁士牙膏对应于整数值2,黑妹牙膏对应于整数值3,依此类推,其他品牌对应于整数值8,0对应于空白如表2所示。
睦侧蒙问凯员娃山舷藉僚泽奄悲窗蓄冷阿炕嵌答舶谋挪涩皖鞠脯辣阳扣级趋势分析中一种增量数据挖掘方法研究趋势分析中一种增量数据挖掘方法研究
马尔可夫链
对于整数值随机变量序列{xn, n≥0},给定非负整数i0, i1, ·······, in, in+1, 如果p(xn+1=in+1| x0=i0, x1=i1, ·····xn=in)= p(xn+1=in+1| x0=i0), 那么{xn, n≥0}
您可能关注的文档
最近下载
- 宜家产品数字化交互体验设计研究--以家具产品互动光影体验设计为例.pdf VIP
- 部编语文五年级下册第三单元《猜字谜》ppt课件.pptx
- 重症肌无力护理查房PPT课件.pptx VIP
- 管壳式换热器的建模换热计算和CFD模拟资料.doc
- 中学小学幼儿园托儿所膳食监督家长委员会职责及工作制度12篇.docx VIP
- 《2023年全国职业院校技能大赛赛项GZ079 商务数据分析赛题第B套》.pdf VIP
- 《2023年全国职业院校技能大赛赛项GZ079 商务数据分析赛题第A套》.pdf VIP
- 《南陵别儿童入京》鉴赏.pptx
- 田园曲声乐正谱钢琴伴奏五线谱柏辽兹.pdf VIP
- +第二单元第一课《观照自然》课件2024-2025学年人美版(2024)初中美术七年级下册.pptx VIP
文档评论(0)