游戏数据聚类分析TwoSteps.pptVIP

  • 30
  • 0
  • 约1.24千字
  • 约 16页
  • 2017-02-04 发布于江苏
  • 举报
聚类分析理论—TwoSteps TwoSteps算法的优势 TwoSteps支持数值型和分类型数据,这对于我们而言在使用时就方便很多,此外游戏数据一般来说都很大,TwoStep在这方面来说还是很具有优势的,数据迭代过程中的内存消耗和聚类数目确定,TwoStep表现的都很好,两步聚类避免了距离矩阵过大,导致算法执行效率下降,而这也是优势所在 。 数据选取 1、这里选取的是次日留存用户数据进行分析,之所以选择次日,是由游戏的特点决定的,再者手机游戏的周期相对短一些,所以如果考虑周,双周就不是很好了(当然也不是绝对的),其实3日留存也可以选择,只是需要了解你自己的游戏具体情况再做判断。 2、这里选取的是次日留存用户数据进行分析,之所以选择次日,是由游戏的特点决定的,再者手机游戏的周期相对短一些,所以如果考虑周,双周就不是很好了(当然也不是绝对的),其实3日留存也可以选择,只是需要了解你自己的游戏具体情况再做判断。 数据选取 既然要做聚类分析,那我们选什么数据作分析,提取特征呢?我们要做的是提取次日留存用户的特征,因此,根据需要我们提取了一些用户的数据点。 SPSS进行数据分析 打开“菜单|分类|两步聚类” SPSS进行数据分析 要进行变量选择,如果是分类变量,就选择进入分类变量,如果是连续变量,就选择进入连续变量。 SPSS进行数据分析 距离变量:确定计算两个变量之间的相似性,对数

文档评论(0)

1亿VIP精品文档

相关文档