关联规则挖掘python案例.docVIP

关联规则挖掘python案例.doc

关联规则挖掘python案例

下面是一个使用Python进行关联规则挖掘的案例：

```python

importpandas

importapyori

data=pandas.read_csv(D:\\DATA\\pycase\\number2\\8.1\\Data.csv)

#apriori与pandas包输出数据格式不兼容，所以进行格式转换

transactions=data.groupby(by=交易ID).apply(lambdax:list(x.购买商品))

#设置参数

min_support=0.5

min_confidence=0.5

min_lift=0.5

max_length=3

#调用apriori方法

results=list(apriori(transactions,min_support=min_support,min_confidence=min_confidence,min_lift=min_lift,max_length=max_length))

#输出度（support），自信度（confidence），提升度（lift），基础项（items_base），推导项（items_add）

supports=[]

confidences=[]

lifts=[]

bases=[]

adds=[]

forrinresults:

supports.append(r.support)

confidences.append(r.ordered_statistics(0).confidence)

lifts.append(r.ordered_statistics(0).lift)

bases.append(list(r.ordered_statistics(0).items_base))

adds.append(list(r.ordered_statistics(0).items_add))

result=pandas.DataFrame({support:supports,confidence:confidences,lift:lifts,bases:bases,adds:adds})

print(result)

```

在这个案例中，我们首先导入了所需的库，然后加载了数据集。接着，我们将数据集转换为交易数据，并设置了关联规则挖掘的参数。然后，我们调用`apriori`方法进行关联规则挖掘，并输出度、自信度、提升度、基础项和推导项等结果。

请注意，上述代码只是一个简单的示例，实际的关联规则挖掘可能需要更复杂的数据预处理和参数调整。如果你有特定的数据和问题

更多 >