关联範例一关联规则基本概念.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联範例一关联规则基本概念.ppt

產生27個規則 調整參數與移除重複規則 #refine and pruning rules rule=apriori(Titan,parameter=list(minlen=2,supp=0.005,conf=0.8),appearance=list(rhs=c(Survived=No,Survived=Yes),default=lhs)) rulesort=sort(rule,by=lift) inspect(rulesort) subset.matrix=is.subset(rulesort,rulesort) redundant=colSums(subset.matrix) 1 which(redundant) rulepruned=rulesort[!redundant] inspect(rulepruned) 限定後項參數為Survived 移除重複規則 再調整前項後項參數的程式碼 rule2=apriori(Titan, control = list(verbose=F),parameter = list(minlen=3, supp=0.002, conf=0.2),appearance = list(default=none, rhs=c(Survived=Yes), lhs=c(Class=1st, Class=2nd, Class=3rd,Age=Child, Age=Adult))) rule2.sorted= sort(rule2, by=confidence) inspect(rule2.sorted) 再審視兒童的存活率和艙等 關聯規則視覺化 library(arulesViz) #Heat map (熱圖) plot(rulepruned) #Balloon plot (氣球圖) plot(rulepruned,method=grouped) # Graph (網路圖) plot(rulepruned,method=graph,control =list(type=items)) # Parallel coordinates plot (平行座標圖) plot(rulepruned, method = paracoord, control = list(reorder = TRUE)) Heat map (熱圖) Balloon plot (氣球圖) Graph (網路圖) 平行座標圖 資料關聯範例四 函數【cspade】檔案 TelRepair.txt 750 cases 5915 records 3 fields 序列分析 序列(Sequence)分析的重點在於資料中必須存在先後順序的關係(例如時間) 序列分析類似於關聯規則,但還得考量時間的先後順序,也就是說著重時間的順序作資料關聯的分析, 序列分析可以提供我們針對客戶客製化行銷的預測,掌握良機,當某位客戶買了某項產品後,就已經預告將來的某個時間點會再度買我們的附加產品或服務 維修案例檔案說明 檔案TelRepair.txt包括750個維修案例,共有 5915紀錄,3個欄位 第1個欄位是ID,對應一份診斷修理報告,第2個欄位紀錄著每個ID修理診斷的順序,第3個欄位紀錄每次修理診斷的動作 每份診斷修理報告開始以代碼90表示(但只有727個案例是),成功完成修理以代碼210表示,若問題無法成功解決,則以代碼299表示 練習失敗案例檔案FailTelRepair.txt 檔案格式(不需欄名) Modeler執行結果(成功率92%=690/750) 重複修理( 22.133% = 166/750個id) 序列分析的程式碼 # cspade TelRepair library(arulesSequences) repair=read_baskets(d:\\stella\\R\\TelRepair.txt,sep=\t,info=c(sequenceID,eventID)) arulesSeq=cspade(repair,parameter = list(supp=0.2),control = list(verbose=T),tmpdir=tempdir()) summary(arulesSeq) as(arulesSeq,data.frame) R執行結果(成功率92%=690/750) 重複修理( 22.133% = 166/750個id) 練習:失敗案例 FailTelRepair.txt * 關聯範例一:關聯規則基本概念 關聯範例二:購物產品關聯分析 關聯範例四:維修案例的序列分析 4 2 3 1 3.資料關聯 Association 關聯範例三:鐵達尼號關聯分析 資料關聯範例一 函數【apriori】檔案 beer.xls

文档评论(0)

jackzjh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档