- 8
- 0
- 约1.19千字
- 约 2页
- 2024-08-28 发布于北京
- 举报
关联规则挖掘python案例
下面是一个使用Python进行关联规则挖掘的案例:
```python
importpandas
importapyori
data=pandas.read_csv(D:\\DATA\\pycase\\number2\\8.1\\Data.csv)
#apriori与pandas包输出数据格式不兼容,所以进行格式转换
transactions=data.groupby(by=交易ID).apply(lambdax:list(x.购买商品))
#设置参数
min_support=0.5
min_confidence=0.5
min_lift=0.5
max_length=3
#调用apriori方法
results=list(apriori(transactions,min_support=min_support,min_confidence=min_confidence,min_lift=min_lift,max_length=max_length))
#输出度(support),自信度(confidence),提升度(lift),基础项(items_base),推导项(items_add)
supports=[]
confidences=[]
lifts=[]
bases=[]
adds=[]
forrinresults:
supports.append(r.support)
confidences.append(r.ordered_statistics(0).confidence)
lifts.append(r.ordered_statistics(0).lift)
bases.append(list(r.ordered_statistics(0).items_base))
adds.append(list(r.ordered_statistics(0).items_add))
result=pandas.DataFrame({support:supports,confidence:confidences,lift:lifts,bases:bases,adds:adds})
print(result)
```
在这个案例中,我们首先导入了所需的库,然后加载了数据集。接着,我们将数据集转换为交易数据,并设置了关联规则挖掘的参数。然后,我们调用`apriori`方法进行关联规则挖掘,并输出度、自信度、提升度、基础项和推导项等结果。
请注意,上述代码只是一个简单的示例,实际的关联规则挖掘可能需要更复杂的数据预处理和参数调整。如果你有特定的数据和问题
原创力文档

文档评论(0)