- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
顾客需求映射规则获取和聚类方法.pdf
顾客需求映射规则获取和聚类方法
Inter-Apriori频繁项集挖掘算法,使用交集策略减少扫描数据库的次数。和Apfiofi算法相比,FP增长算法在第一次遍历数据库
时找到并存储所有的频繁项集,然后按照一定的规则创建一个 FP树 ,挖掘频繁项集的效率比较高;但是当FP树很大的时候,
递归地遍历 FP树的成本变得很高。文献 7【】将 Apfiofi算法和FP增长算法结合在一起 ,提出了一种频繁项集挖掘算法 PIETM
(PrincipleofInclusion-ExclusionandTransactionMapping)。该算法具有Apfiofi算法简便易行的特点和FP增长算法高效率的特
点。PIETM算法在搜索数据库时,通过构造项集树,利用容斥原理去计算项集的支持度,从而快速挖掘出频繁项集。
关联规则挖掘方法的思路为 : (1)获取频繁项集; (2)根据置信度提取强关联规则; (3)关联规则分析处理。当规划
设计实例数据库数据量大时,会产生很多冗余和相似的规则。为了便于规则重用,需要对规则进行去冗余,并进行聚类分析。
模糊聚类分析是常用的聚类方法。文献8【】以原始信号及其 DLMD所得PF分量的样本熵作为模糊聚类的特征向量,提出了一种
基于DLMD样本熵和模糊聚类的滚动轴承故障诊断方法,对特征向量进行识别分类。文献9【】采用了基于模糊 c均值和Apfiofi
算法的FCM—Apfiofi模型用于道路交通的性能预测,模糊 c均值和Apfiofi算法分别用来定义模糊集隶属度函数和确定模糊关联
规则。文献 【l0】采用人工神经网络方法来确定类别的最优数量,以便更好对规则进行模糊聚类。粗糙集方法具有能有效处理数
据的模糊性和不确定性,以及不需要所处理数据以外的先验知识等优点,获得广泛应用。本文采用粗糙集方法获取并处理顾客
需求可选值以及功能需求可选值之间的关联程度,采用基于粗糙集的传递闭包法对顾客需求值以及功能需求值进行聚类 ,进而
实现对已获取关联规则的聚类处理。
本文在PIETM算法的基础之上,提出了顾客需求映射规则获取方法,采用容斥原理计算项集的支持度筛选出频繁项集,
根据置信度挖掘出强关联规则;采用基于粗糙集的模糊聚类方法,通过对顾客需求值和功能需求值进行聚类实现规则聚类分
析。最后以某企业产品的顾客需求映射规则挖掘和聚类分析为例,验证了所提方法的有效性。
1 问题描述
假设设计知识数据库D=fCR。,CR2,…,CR,DR,:,…,珊 }。CR(1≤≤m)代表第i项顾客需求;DRj(1 ≤n)代表第
项设计需求 。T_CD代表数据库中的一个记录 ,T=F UB ,F 和 曰分别为记录的前项集和后项集 ,其中 F
{cRl,CR2,…,CR),B {D ,珊2,…,腑 ),g=l,2,…,Ⅳ,N代表数据库中记录的总数。从D中挖掘出的规则为: y,其
中 ,YC_B。数据库D关联规则挖掘是提取支持度 (Suppo~)不小于预先定义的最小支持度 (Min_sup)以及置信度
(Confidence)不小于预先定义的最小置信度 (Min_con)的规则。
定义1强关联规则:对于规则r,,如果其支持度sup(r’l)IMin_sup,置信度con(r,)tMin_conf,那么称该规则为一个强
关联规则。
定义2 规则冗余:对于两个强关联规则r(X。y)andr(X y:),如果X_cx:并且y:y,r:为一个冗余规则,需
要删除。
定义3 规则聚类。对于任意两条强关联规则r(X y),r(X: y:)。X。= li∈m。},X2={ ∈m2},Y。={li∈n),
y={ En o其中, ∈CR,1 ~DR,表示它们分别属于同一个CR和DR。当距离d( z),d(y·,Y:)小于预先设定
的最小值时,两条规则可以聚类归为一类。
本文基于容斥原理计算项集的支持度 ,筛选出频繁项集。容斥原理又称包含排斥原理 ,是组合数学中解决计数问题的一个
重要工具 ll【1。
容斥原理在组合数学中可用如下公式表示 :
1 . I
Ili01AIl=∑…一∑IANAl+∑lANAAA小…(一1) nA…NAI (1)
i= 1 1《 《 1《f 《n
其中,A ·A·为有限的集合,IAI表示集合A;中包含的项的个数。UA表示n个集合并集的元素个数。
设提取的规则r’(Xjy),r’2(
文档评论(0)