张云春《数据挖掘》第5章 Weka 中数据操作.docxVIP

  • 59
  • 0
  • 约6.74千字
  • 约 26页
  • 2017-07-30 发布于浙江
  • 举报

张云春《数据挖掘》第5章 Weka 中数据操作.docx

第5章 Weka 中数据操作5.1数据集的预处理5.1.1向Weka中导入数据集,如图 5-0,5-1; 图 5-0导入Weka中的原始数据集 将excel格式的数据集原本另存为csv格式,存为csv格式后,用记事本打开,另存为UTF-8编码格式。之后打开Weka界面,选择Explorer ,进入preprocess界面,选择open file 按钮,打开保存的csv文件,即成功导入数据集。 从current relation里可以看到数据集的内容概况。Edit 里面可以从viewer界面查看数据集内容。也可以进行简单的编辑修改。Save将打开的csv文件保存为arff格式文件。 图5-0导入Weka中的原始数据集Viewer图如图5-0,5-1所示,原始数据集有748个实例,196条属性。数据集内容为某商品一个月的销售记录,记录模式为T和F. T代表购买此种商品,F代表没有购买此种商品。第一条属性值为顾客编号,第一行实例值为商品编号,其他均为顾客购买情况(T/F)。5.1.2数据集简单处理 数据集的简单处理在于删除一些无关于实验分析结果的相关条件。对于这个数据集做出处理如下: 由图5-0,图5-1可知,商品购买情况分为T和F两种。本次数据挖掘目的在于进行购物篮分析,挖掘顾客购买商品之

文档评论(0)

1亿VIP精品文档

相关文档